Docker镜像讲解
镜像是什么
镜像是一种轻量级、可执行的独立软件包,用来打包软件运行环境和基于运行环境开发的软件,它包含运行某个软件所需要的内容,包括代码、运行时、库、环境变量和配置文件。
所有的应用,直接打包成docker镜像,就可以直接跑起来!
如何得到镜像:
- 从远程仓库下载
- 朋友拷贝给你
- 自己制作一个镜像DockerFile
Docker镜像加载原理
UnionFS(联合文件系统)
我们下载的时候看到的一层层就是这个!
Union文件系统(UnionFS)是一种分层,轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem)。Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
特性:一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层文件和目录。
比如,现在有2个镜像,一个tomcat,一个mysql,底下都要用到linux内核,假设是centos
,现在tomcat下载了centos,我的mysql就不需要下载了,他们是共用的,非常节省内存和空间。
Docker镜像加载原理
docker的镜像实际上由一层一层的文件系统组成,这种层级的文件系统UnionFS。
bootfs(boot file system)主要包含bootloader和kernel,bootloader主要是引导kernel,linux刚启动时会加载bootfs文件系统,在Docker镜像的最底层是bootfs。这一层与我们典型的linux/unix系统是一样的,包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。
bootfs:任何一个系统启动需要引导加载,我们启动的时候需要一个内核和一个加载器bootloader,内核加载成功之后,系统就运行起来了,运行起来后这个加载就没了,这个加载是公用的
rootfs(root file system),在bootfs之上。包含的就是典型linux系统中的/dev,/proc,/bin,/etc等标准目录和文件。rootfs就是各种不同的操作系统发行版,比如ubuntu,centos等等。
rootfs:这个系统之后,就会变成一个基本的linux系统,就是我们开机了,开机后,就变成了典型的linux文件系统,在这里面就是一个小型的linux,这就是我们所说的为什么我们启动之后,一个容器就是一个小的虚拟机环境,比如centos,只是在这一层有了些许的变化。
平时我们安装的虚拟机的centos都是好几个G,为什么Docker这里才200M呢
对于一个精简的OS,rootfs可以很小,只需要包含最基本的命令,工具和程序库就可以了,因为底层直接用Host的kernel,自己只需要提供rootfs就可以了,由此可见对于不同的Linux发行版,bootfs基本是一致的,rootfs会有差别,因此不同的发现版可以公用bootfs。
虚拟机是分钟级别的,容器是秒级!
分层理解
分层的镜像
我们可以下载一个镜像,注意观察下载的日志输出,可以看到是一层一层的在下载!
思考:为什么Docker镜像要采用这种分层的结构呢?
最大的好处,我觉得莫过于资源共享了!比如有多个镜像都从相同的Base镜像构建而来,那么宿主机只需要在磁盘上保留一份base镜像,同时内存中也只需要加载一份base镜像,这样就可以为所有的容器服务了,而且镜像的每一层都可以被共享。
查看镜像分层的方式可以通过docker image inspect 命令!
命令:docker inspect 镜像id
docker inspect redis:latest
理解:
所有的Docker镜像都起始于一个基础镜像层,当进行修改或增加新的内容时,就会在当前镜像层之上,创建新的镜像层。举一个简单的例子,假如基于Ubuntu Linux 16.04创建一个新的镜像,这就是新镜像的第一层,如果在该镜像中添加python包,就会在基础镜像层之上创建第2个镜像层,如果添加一个安全补丁,就会创建第3个镜像层。
该镜像当前已经包含3个镜像层,如下图所示(这只是一个用于演练的很简单的例子)。
在添加额外的镜像层同时,镜像始终保持时当前所有镜像的组合,理解这一点非常重要。下图举了一个简单的列子,每个镜像层包含3个文件,而镜像包含了来自2个镜像层的6个文件。
上图的镜像层跟之前的图略有区别,主要目的便于展示文件。
下图展示一个稍微复杂的3层镜像,在外部看来整个镜像只有6个文件,这是因为最上层的文件7是文件5的一个更新版本。
这种情况下,上次镜像层的文件覆盖了底层镜像层的文件。这样就使得文件的更新版本作为一个新镜像层添加到镜像当中。
Docker通过存储引擎(新版本可以采用快照机制)的方式来实现镜像层堆栈,并保证多镜像层对外展示同一的文件系统。
Linux上可用的存储引擎有AUFS、Overlay2、Device Mapper、Btrfs以及ZFS。顾名思义,每种存储引擎都基于linux中对应的文件系统或者块设备技术,并且每种存储引擎都有其独特的性能特点。
Docker在Windows上仅支持windowsfilter一种存储引擎,该引擎基于NTFS文件系统之上实现了分层和Cow[1]。
下图展示了系统显示的3层镜像。所有镜像层堆叠并合并,对外提供统一的视图。
特点:
Docker镜像都是只读的,当容器启动时,一个新的可写层被加载到镜像顶部!
这一层就是我们通常说的容器层,容器之下的都叫镜像层!
如何提交一个自己的镜像。
commit镜像
docker commit 提交容器成为一个新的副本
# 命令和git原理类似
docker commit -m=”提交的描述信息” -a=”作者”容器id 目标镜像名:[TAG]
实战测试
- 启动一个默认的tomcat
- 发现这个tomcat是没有webapps应用,镜像的原因,官方的镜像默认webapps下面是没有文件的!
- 我自己拷贝进去基础的文件、
- 将我们操作过的容器通过commit提交为一个镜像!我们以后就使用我们修改过的镜像即可,这就是我们自己的一个修改的镜像。
学习方式说明:理解概念,但是一定要去实践,最后实践和理论相结合一次搞定这个知识
如果你想要保存当前的容器状态,就可以通过commit来提交,获得一个镜像
就好比我们以前学习VM时候,做的一个快照!
到这里才算是入门Docker