【Docker学习笔记(二)】镜像、容器数据卷

【Docker 学习笔记目录】


【本文目录】


1 镜像

镜像是一种轻量级、可执行的独立软件包,用来打包 软件运行环境 和 基于运行环境开发的软件。它包含某个软件所需的所有内容,包括代码、运行时环境、库、环境变量和配置文件。

1.1 UnionFS(联合文件系统)

Union 文件系统(UnionFS)是一种分成、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下。Union 文件系统是 Docker 镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。

就像一个榴莲千层一样 :)

特性:一次同时加载多个文件系统,但从外面只能看到一个文件系统。联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。

1.2 Docker镜像加载原理

Docker 的镜像实际上由一层一层的文件系统组成,这种层级的文件系统叫做 Union 文件系统(UnionFS)。

Union 文件系统的目录结构就像普通 linux 的目录结构一样,Docker 通过这些文件再加上宿主机的内核提供了一个 linux 的虚拟环境。每一层文件系统我们叫做一层 layer,联合文件系统可以对每一层文件系统设置三种权限,只读(readonly)、读写(readwrite)和写出(whiteout-able),但是 docker 镜像中每一层文件系统都是只读的。

从基本的看起,一个典型的 Linux 文件系统由 bootfs 和 rootfs 两部分组成。

  • bootfs(boot file system) 主要包含bootloader 和 kernel,bootloader 主要用于引导加载 kernel,当 kernel 被加载到内存中后 bootfs 会被 umount 掉。
  • rootfs (root file system) 包含的就是典型 Linux 系统中的/dev,/proc,/bin,/etc 等标准目录和文件。上图就是 Docker 镜像中最基础的两层结构,不同的 linux 发行版(如 ubuntu 和 CentOS ) 在 rootfs 这一层会有所区别,体现发行版本的差异性。

构建镜像的时候,从一个最基本的操作系统开始,每个构建的操作都相当于做一层的修改,增加了一层文件系统。一层层往上叠加,上层的修改会覆盖其底层的可见性。当你使用的时候,你只会看到一个完全的整体,你不知道里面有几层,也不清楚每一层所做的修改是什么。结构类似这样:

传统的 Linux 加载 bootfs 时会先将 rootfs 设为 read-only,然后在系统自检之后将 rootfs 从 read-only 改为 read-write,然后我们就可以在 rootfs 上进行读写操作了。

但 Docker 在 bootfs 自检完毕之后并不会把 rootfs 的 read-only 改为 read-write,而是利用 union mount(UnionFS 的一种挂载机制)将镜像中的其他的 layer 加载到之前的 read-only 的 rootfs 层之上,每一层 layer 都是 rootfs 的结构,并且是 read-only 的。

所以,我们是无法修改一个已有镜像里面的 layer 的!只有当我们创建一个容器,也就是将 Docker 镜像进行实例化,系统会分配一层空的 read-write 的 rootfs ,用于保存我们做的修改。一层 layer 所保存的修改是增量式的,就像 git 一样。

PS:容器启动时,一个新的可写成被加载到镜像的顶部。这一层通常被称为 “容器层” ,“容器层” 之下的都叫 “镜像层” 。

综上,镜像其实就是一个文件系统,它与宿主机的内核一起为程序提供一个虚拟的 linux 环境。在加载 Docker 镜像创建并启动 Docker 容器时,依据镜像,Docker 会为 容器 构建出一个虚拟的 linux 环境。

这也就是为什么 Docker 中的 centos 镜像才 200M 的原因,其精简了很多东西,只包含最基本的命令、工具和程序库,而底层直接用宿主机的的 kernel ,自己提供了 rootfs 。

分成的镜像

理论有点难理解,我们可以直接看回 centos7 。现在 pull 一个新的镜像,可以看到终端的输出,镜像是一层一层的下载的。

[root@localhost haha]# docker pull ubuntu
Using default tag: latest
latest: Pulling from library/ubuntu
c64513b74145: Pull complete 
01b8b12bad90: Pull complete 
c5d85cf7a05f: Pull complete 
b6b268720157: Pull complete 
e12192999ff1: Pull complete 
Digest: sha256:3f119dc0737f57f704ebecac8a6d8477b0f6ca1ca0332c7ee1395ed2c6a82be7
Status: Downloaded newer image for ubuntu:latest

为什么 Docker 镜像要采用分层结构呢?

其中最大的好处就是 共享资源。其他相同环境的镜像都共同去享用同一个环境镜像,而不需要每个镜像要去创建一个底层环境。

比如:有多个镜像都从相同的 base 镜像构建而来,那么宿主机只需在磁盘上保存一份 base 镜像,同时内存中也只需加载一份 base 镜像,就可以为所有容器服务了。而且镜像的每一次都可以被共享。


2 Docker 容器数据卷

2.1 容器数据卷概述

Docker 容器产生的数据,如果不通过 docker commit 生成新的镜像,使得数据作为镜像的一部分保存下来,那么当容器删除后,数据自然也就没有了。那么如何在 Docker 容器中保证数据持久化呢?我们可以使用 Docker 容器数据卷。

PS: Docker 容器数据卷有点类似 Redis 里面的 rdb 和 aof 文件。

容器数据卷就是目录或文件,存在于一个或多个容器中,由 Docker 挂载到容器,但不属于联合文件系统,因此可以绕过联合文件系统提供一些用于持续存储或共享数据的特性。

  • 其设计目的就是数据的持久化,完全独立于容器的生存周期,因此 Docker 不会在容器删除的时候删除其挂载的数据卷

特点:

  • 1、数据卷可在容器之间共享或重用数据
  • 2、数据卷中的更改可以直接生效
  • 3、数据卷中的更改不会包含在镜像的更新中
  • 4、数据卷的生命周期一直持续到没有容器使用它为止

2.2 添加容器数据卷

1、直接命令添加

  • docker run -it -v /宿主机绝对路径目录:/容器内目录 <镜像名>
    • docker run -it -v /宿主机绝对路径目录:/容器内目录:ro <镜像名> 表示禁止读写,只能查看,即read-only。
[root@localhost haha]# docker run -it -v /hosttest:/containertest centos
[root@5cb2f21227a9 /]# ls
bin  containertest  dev  etc  home  lib  lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
[root@5cb2f21227a9 /]# [root@localhost haha]# 
[root@localhost haha]# cd ..
[root@localhost home]# cd ..
[root@localhost /]# ls
bin  boot  dev  etc  home  hosttest  lib  lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
[root@localhost /]# 

我们在本地创建了一个 hosttest 文件夹,然后使用命令 docker run -it -v /hosttest:/containertest centos 创建并启动了 centos 容器。可以发现,在容器根目录下有一个我们指定与宿主机 hosttest 文件夹绑定的 container 文件夹。

接着使用命令 docker inspect 可以看到输出结果有下面这么一段,其表示将宿主机 hosttest 文件夹与容器中的 container 文件夹绑定起来了,并且读写权限为 true。

"Mounts": [
            {
                "Type": "bind",
                "Source": "/hosttest",
                "Destination": "/containertest",
                "Mode": "",
                "RW": true,
                "Propagation": "rprivate"
            }
        ],

然后我们来试试是否真的挂载成功了,现在宿主机这边创建一个文件 test1.txt ,然后查看容器内是否有这个文件。

[root@localhost /]# cd hosttest
[root@localhost hosttest]# ls
test1.txt
[root@localhost hosttest]# docker attach 5cb2f21227a9
[root@5cb2f21227a9 /]# cd containertest
[root@5cb2f21227a9 containertest]# ls
test1.txt

结果是有的,说明我们挂载成功了。现在我们来试试,容器停止退出后,主机修改后数据是否同步。首先退出容器,然后创建一个新的文件 test_new.txt ,接着重启并进入容器查看是否有这个新文件。

[root@5cb2f21227a9 containertest]# ls
test1.txt
[root@5cb2f21227a9 containertest]# exit
exit
[root@localhost hosttest]# touch test_new.txt
[root@localhost hosttest]# ls
test1.txt  test_new.txt
[root@localhost hosttest]# docker ps
CONTAINER ID        IMAGE               COMMAND             CREATED             STATUS              PORTS               NAMES
[root@localhost hosttest]# docker start 5cb2f21227a9
5cb2f21227a9
[root@localhost hosttest]# docker attach 5cb2f21227a9
[root@5cb2f21227a9 /]# ls
bin  containertest  dev  etc  home  lib  lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
[root@5cb2f21227a9 /]# cd containertest
[root@5cb2f21227a9 containertest]# ls
test1.txt  test_new.txt

以上输出结果说明,容器停止退出后,主机修改后数据是同步的

2、Dockerfile 添加

这里先简单介绍 Dockerfile ,在【Docker学习笔记(三)】中我将会详细介绍 Dockerfile 。

(1)首先在根目录下新建 mydocker 文件夹并进入,然后创建一个文件 Dockerfile,并在 Dockerfile 中使用 VOLUME 指令给镜像添加一个或多个数据卷。

# volume test
FROM centos
VOLUME ["dataVolumeContainer1","dataVolumeContainer2"
CMD echo "finished------------------success"
CMD /bin/bash
  • 第一句为注释
  • 第二句定义了使用 centos 镜像作为基础镜像启动构建流程
  • 第三句表示挂载的容器数据卷的文件夹名称
  • 第四句输出指定字符串
  • 第五句指定shell

(2)使用指定 Dockerfile build 生成镜像

[root@localhost mydocker]# docker build -f /mydocker/Dockerfile -t xyz/centos .
Sending build context to Docker daemon  2.048kB
Step 1/4 : FROM centos
 ---> 49f7960eb7e4
Step 2/4 : VOLUME ["dataVolumeContainer1","dataVolumeContainer2"
 ---> Running in ba37709e6097
Removing intermediate container ba37709e6097
 ---> 8cd8f930eb1a
Step 3/4 : CMD echo "finished------------------success"
 ---> Running in 3d05f7ec8ae9
Removing intermediate container 3d05f7ec8ae9
 ---> d62062dc1b2f
Step 4/4 : CMD /bin/bash
 ---> Running in f784a862da37
Removing intermediate container f784a862da37
 ---> 5b762df8de53
Successfully built 5b762df8de53
Successfully tagged xyz/centos:latest
[root@localhost mydocker]# docker images
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
xyz/centos          latest              5b762df8de53        55 seconds ago      200MB
ubuntu              latest              735f80812f90        4 days ago          83.5MB
nginx               latest              c82521676580        6 days ago          109MB
tomcat              latest              2d43521f2b1a        13 days ago         463MB
centos              latest              49f7960eb7e4        8 weeks ago         200MB

可以看到我们成功使用 Dockerfile 创建了一个镜像 xyz/centos。

(3)使用 镜像 xyz/centos 创建一个容器

[root@localhost mydocker]# docker run -it xyz/centos
[root@2ade6afcbf0a /]# ll
total 0
lrwxrwxrwx.   1 root root   7 May 31 18:02 bin -> usr/bin
drwxr-xr-x.   2 root root   6 Jul 31 07:35 dataVolumeContainer1
drwxr-xr-x.   2 root root   6 Jul 31 07:35 dataVolumeContainer2
drwxr-xr-x.   5 root root 360 Jul 31 07:35 dev
drwxr-xr-x.   1 root root  66 Jul 31 07:35 etc
drwxr-xr-x.   2 root root   6 Apr 11 04:59 home
...

可以看到容器内指定的数据卷被创建了。

(4)查看主机对应默认地址

使用 docker inspect 查看容器内指定的数据卷对应的宿主机目录地址。

"Mounts": [
            {
                "Type": "volume",
                "Name": "964dfe423c1074d1e2689e4f68f38766076fd808d94352aecdb87585fb515796",
                "Source": "/var/lib/docker/volumes/964dfe423c1074d1e2689e4f68f38766076fd808d94352aecdb87585fb515796/_data",
                "Destination": "dataVolumeContainer1",
                "Driver": "local",
                "Mode": "",
                "RW": true,
                "Propagation": ""
            },
            {
                "Type": "volume",
                "Name": "320a381171241f0f4838face8e4bf390197573b62247fa293af7ed51ea002db0",
                "Source": "/var/lib/docker/volumes/320a381171241f0f4838face8e4bf390197573b62247fa293af7ed51ea002db0/_data",
                "Destination": "dataVolumeContainer2",
                "Driver": "local",
                "Mode": "",
                "RW": true,
                "Propagation": ""
            }
        ],

2.3 数据卷容器

如果用户需要在多个容器之间共享一些持续更新的数据,最简单的方式是使用数据卷容器。数据卷容器也是一个容器,但是它的目的是专门用来提供数据卷供其他容器挂载。

首先使用命令 docker run -it --name docker1 xyz/centos 创建一个容器 docker1 ,然后进入到 dataVolumeContainer1 里面新建一个文件 docker1.txt。然后将这个容器挂到后台。

[root@localhost mydocker]# docker run -it --name docker1 xyz/centos
[root@5595f81fc0db /]# ls
bin  dataVolumeContainer1  dataVolumeContainer2  dev  etc  home  lib  lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
[root@5595f81fc0db /]# cd dataVolumeContainer1
[root@5595f81fc0db dataVolumeContainer1]# touch docker1.txt
[root@5595f81fc0db dataVolumeContainer1]# [root@localhost mydocker]# 

接着,使用命令 docker run -it --name docker2 --volumes-from docker1 xyz/centos 创建一个容器 docker2 ,并挂载 docker1 容器中的数据卷

[root@localhost mydocker]# docker run -it --name docker2 --volumes-from docker1 xyz/centos
[root@abe10fe61dc8 /]# ls
bin  dataVolumeContainer1  dataVolumeContainer2  dev  etc  home  lib  lib64  media  mnt  opt  proc  root  run  sbin  srv  sys  tmp  usr  var
[root@abe10fe61dc8 /]# cd dataVolumeContainer1
[root@abe10fe61dc8 dataVolumeContainer1]# ls
docker1.txt
[root@abe10fe61dc8 dataVolumeContainer1]# 

这就是数据卷容器最基本的应用啦。也许会有人想问,我能不能再创建一个容器 docker3 挂载 docker1 呢?

当然可以。如果这样做了,就相当于有一个共享目录,连接着 docker1、docker2、docker3。

那这时候我删除了容器 docker1 的话,共享目录是不是会消失呢?

不会!因为数据容器卷的生命周期一直持续到没有容器使用它为止。