上一篇:Docker的那些事儿—Docker使用的核心底层技术(6)
Union file systems
前面介绍了Namespace和Cgroups,这两项技术都是与容器相关。Docker的一大创新之处采用了——Union file systems(联合文件系统,UnionFS)技术。它是实现Docker镜像的技术基础,是一种轻量级的高性能分层文件系统,支持对文件系统中的修改作为一次提交来一层层的叠加,这个特性使得镜像可以通过分层实现和继承。Docker镜像分为基础镜像和父镜像,没有父镜像的镜像被称为基础镜像。用户可以基于基础镜像来制作各种不同的应用镜像。这些应用镜像共享同一个基础镜像层,提高了存储效率。同时UnionFS支持将不同目录挂载到同一个虚拟文件系统下。
Docker目前支持的UnionFS种类包括AUFS,btrfs,vfs和 DeviceMapper。
AUFS是一种 Union FS, 简单来说就是“支持将不同目录挂载到同一个虚拟文件系统下的文件系统”, AUFS支持为每一个成员目录设定只读(Rreadonly)、读写(Readwrite)和写(Whiteout-able)权限。
典型的Linux启动时运行需要两个文件系统:bootfs 和rootfs。
bootfs主要包含BootLoader和Kernel, BootLoader主要是引导加载Kernel, 当Boot成功后,Kernel被加载到内存中,然后bootfs就被Umount掉了。rootfs包含Linux系统中的/dev、/proc、/bin、/etc等标准目录和文件。
在Docker中,不同的Linux发行版可以共享bootfs,这是因为bootfs基本是一致的, 只是rootfs存在差别。例如下图中的Debian和BusyBox(一种嵌入式Linux)
Linux在启动后,首先将rootfs置为 Readonly,进行一系列检查后将其切换为Readwrite供用户使用。在Docker中,也是利用该技术,然后利用Union Mount在Readonly的rootfs文件系统之上挂载Readwrite文件系统。并且向上叠加, 使得一组Readonly和一个Readwrite的结构构成一个容器的运行目录、每一个被称作一个文件系统Layer。
AUFS的特性, 使得每一个对Readonly层文件/目录的修改都只会存在于上层的Writeable层中。这样使得多个容器可以共享Readonly文件系统层。在Docker中,将Readonly的层称作image,将Writeable层称作container。对于容器整体而言,整个rootfs变得是read-write的,但事实上所有的修改都写入最上层的container中,image不保存用户状态,可以用于模板、重建和复制。
在Docker中,上层的image依赖下层的image, 因此Docker中把下层的image称作父image,没有父image的image称作Base image。比如上图中Debian就是Base image,执行add emacs后生成的image就是执行add Apache后生成的image的父image。因此,当想要从一个image启动一个容器,Docker会先逐次加载其父image直到Base image,用户的进程运行在Writeable的文件系统层中。这一点,我们在后面讲解Docker image时会着重讲解。
下一章节,我们进入Docker镜像部分学习