Docker 简介

Docker 是一种新兴的虚拟化方式，跟传统的虚拟化方式相比具有众多的优势。

更高效的利用系统资源：由于容器不需要进行硬件虚拟以及运行完整操作系统等额外开销，Docker 对系统资源的利用率更高。无论是应用执行速度、内存损耗或者文件存储速度，都要比传统虚拟机技术更高效。因此，相比虚拟机技术，一个相同配置的主机，往往可以运行更多数量的应用。
更快速的启动时间：传统的虚拟机技术启动应用服务往往需要数分钟，而 Docker 容器应用，由于直接运行于宿主内核，无需启动完整的操作系统，因此可以做到秒级、甚至毫秒级的启动时间。大大的节约了开发、测试、部署的时间。
一致的运行环境：开发过程中一个常见的问题是环境一致性问题。由于开发环境、测试环境、生产环境不一致，导致有些 bug 并未在开发过程中被发现。而 Docker 的镜像提供了除内核外完整的运行时环境，确保了应用运行环境一致性，从而不会再出现 「这段代码在我机器上没问题啊」 这类问题。
持续交付和部署：对开发和运维人员来说，最希望的就是一次创建或配置，可以在任意地方正常运行。使用 Docker 可以通过定制应用镜像来实现持续集成、持续交付、部署。开发人员可以通过 Dockerfile 来进行镜像构建，并结合持续集成系统进行集成测试，而运维人员则可以直接在生产环境中快速部署该镜像，甚至结合持续部署系统进行自动部署。而且使用 Dockerfile 使镜像构建透明化，不仅仅开发团队可以理解应用运行环境，也方便运维团队理解应用运行所需条件，帮助更好的生产环境中部署该镜像。
更轻松的迁移：由于 Docker 确保了执行环境的一致性，使得应用的迁移更加容易。Docker 可以在很多平台上运行，无论是物理机、虚拟机、公有云、私有云，甚至是笔记本，其运行结果是一致的。因此用户可以很轻易的将在一个平台上运行的应用，迁移到另一个平台上，而不用担心运行环境的变化导致应用无法正常运行的情况。
更轻松的维护和扩展：Docker 使用的分层存储以及镜像的技术，使得应用重复部分的复用更为容易，也使得应用的维护更新更加简单，基于基础镜像进一步扩展镜像也变得非常简单。此外，Docker 团队同各个开源项目团队一起维护了一大批高质量的官方镜像，既可以直接在生产环境使用，又可以作为基础进一步定制，大大的降低了应用服务的镜像制作成本。

基本概念

镜像

镜像是一个特殊的文件系统，除了提供容器运行时所需的程序、库、资源、配置等文件外，还包含了一些为运行时准备的一些配置参数（如匿名卷、环境变量、用户等）。镜像不包含任何动态数据，其内容在构建之后也不会被改变。

因为镜像包含操作系统完整的 root 文件系统，其体积往往是庞大的，因此在 Docker 设计时，就充分利用 Union FS 的技术，将其设计为分层存储的架构。所以严格来说，镜像并非是像一个 ISO 那样的打包文件，镜像只是一个虚拟的概念，其实际体现并非由一个文件组成，而是由一组文件系统组成，或者说，由多层文件系统联合组成。

镜像构建时，会一层层构建，前一层是后一层的基础。每一层构建完就不会再发生改变，后一层上的任何改变只发生在自己这一层。比如，删除前一层文件的操作，实际不是真的删除前一层的文件，而是仅在当前层标记为该文件已删除。在最终容器运行的时候，虽然不会看到这个文件，但是实际上该文件会一直跟随镜像。因此，在构建镜像的时候，需要额外小心，每一层尽量只包含该层需要添加的东西，任何额外的东西应该在该层构建结束前清理掉。

分层存储的特征还使得镜像的复用、定制变的更为容易。甚至可以用之前构建好的镜像作为基础层，然后进一步添加新的层，以定制自己所需的内容，构建新的镜像。

容器

镜像（Image）和容器（Container）的关系，就像是面向对象程序设计中的类和实例一样，镜像是静态的定义，容器是镜像运行时的实体。容器可以被创建、启动、停止、删除、暂停等。

容器的实质是进程，但与直接在宿主执行的进程不同，容器进程运行于属于自己的独立的命名空间。因此容器可以拥有自己的 root 文件系统、自己的网络配置、自己的进程空间，甚至自己的用户 ID 空间。容器内的进程是运行在一个隔离的环境里，使用起来，就好像是在一个独立于宿主的系统下操作一样。这种特性使得容器封装的应用比直接在宿主运行更加安全。也因为这种隔离的特性，很多人初学 Docker 时常常会混淆容器和虚拟机。

前面讲过镜像使用的是分层存储，容器也是如此。每一个容器运行时，是以镜像为基础层，在其上创建一个当前容器的存储层，我们可以称这个为容器运行时读写而准备的存储层为 容器存储层。

容器存储层的生存周期和容器一样，容器消亡时，容器存储层也随之消亡。因此，任何保存于容器存储层的信息都会随容器删除而丢失。

按照 Docker 最佳实践的要求，容器不应该向其存储层内写入任何数据，容器存储层要保持无状态化。所有的文件写入操作，都应该使用==数据卷==或者==绑定宿主目录==，在这些位置的读写会跳过容器存储层，直接对宿主（或网络存储）发生读写，其性能和稳定性更高。

数据卷的生存周期独立于容器，容器消亡，数据卷不会消亡。因此，使用数据卷后，容器删除或者重新运行之后，数据却不会丢失。

仓库

镜像构建完成后，可以很容易的在当前宿主机上运行，但是，如果需要在其它服务器上使用这个镜像，我们就需要一个集中的存储、分发镜像的服务，Docker Registry 就是这样的服务。一个 Docker Registry 中可以包含多个仓库（Repository）；每个仓库可以包含多个标签（Tag）；每个标签对应一个镜像。

通常，一个仓库会包含同一个软件不同版本的镜像，而标签就常用于对应该软件的各个版本。我们可以通过 <仓库名>:<标签> 的格式来指定具体是这个软件哪个版本的镜像。如果不给出标签，将以 latest 作为默认标签。以 Ubuntu 镜像为例，ubuntu 是仓库的名字，其内包含有不同的版本标签，如，16.04, 18.04。我们可以通过 ubuntu:16.04，或者 ubuntu:18.04 来具体指定所需哪个版本的镜像。如果忽略了标签，比如 ubuntu，那将视为 ubuntu:latest。仓库名经常以两段式路径形式出现，比如 kingfalse/java8，前者往往意味着 Docker Registry 多用户环境下的用户名，后者则往往是对应的软件名。但这并非绝对，取决于所使用的具体 Docker Registry 的软件或服务。

安装 Docker

使用镜像创建一个容器，该镜像必须与 Docker 宿主机系统架构一致，例如 Linux x86_64 架构的系统中只能使用 Linux x86_64 的镜像创建容器。Windows、macOS 除外，其使用了 binfmt_misc 提供了多种架构支持，在 Windows、macOS 系统上 (x86_64) 可以运行 arm 等其他架构的镜像。

安装指南详见: https://docs.docker.com/desktop/

使用镜像

从镜像仓库拉取镜像

docker pull [选项] [Docker Registry 地址[:端口号]/]仓库名[:标签]

Docker 镜像仓库地址：地址的格式一般是 <域名/IP>[:端口号]。默认地址是 Docker Hub(docker.io)。
仓库名：仓库名是两段式名称，即 <用户名>/<软件名>。对于 Docker Hub，如果不给出用户名，则默认为 library，也就是官方镜像。

案例：

# 拉取官方 ubuntu 镜像
docker pull ubuntu:18.04

# 拉取用户 kingfalse 构建的 oracle-java8 镜像
docker pull kingfalse/java8

查看本地镜像

Docker 常用以下四种查看本地镜像：

查看本地顶层镜像: docker image ls 或 docker images 。输出日志由 REPOSITORY、TAG、IMAGE ID、CREATED、SIZE 5个字段组成。一个镜像可以对应多个 REPOSITORY，IMAGE ID 是镜像的唯一标识。
查看所有镜像：docker image ls -a 。它包含了顶层镜像和中间层镜像。中间层镜像是为了加快镜像构建、重复利用资源而存在的，一般不建议主动删除中间层镜像。
根据仓库名列出镜像：docker image ls 仓库名 或 docker image ls 仓库名:标签。
按构建时间过滤镜像：docker image ls -f since=仓库名:标签 列出在仓库名:标签之后构建的镜像。-f 全称是 --filter，将 since 替换为 before 可以列出之前构建的镜像。

(1) REPOSITORY、TAG 都为的镜像是虚悬镜像，即失去价值的镜像。可能是由于镜像名被赋予了新的镜像，或镜像构建过程中出现错误导致的。可以使用 docker image prune 批量删除虚悬镜像。

(2) 添加 --digests，可以显示镜像的信息摘要 (DIGEST) sha256。

(3) 添加 -q，只显示符合条件的镜像 ID。

删除镜像

docker image rm <镜像1> <镜像2> ...

<镜像> 可以是镜像短 ID、镜像长 ID、镜像名或镜像摘要。

此外，它还支持与“查看本地镜像”功能进行结合（使用 -q 表示只列出 ID），实现批量删除：

docker image rm $(docker image ls -q [Limit])

删除虚悬镜像：docker image prune

定制镜像

案例 1：构建基于 ubuntu 18.04 的 Oracle-JDK8 环境

需要将 Dockerfile 与 jdk-8u261-linux-x64.tar 文件放在同一目录下，Dockerfile 文件内容：

FROM ubuntu:18.04

MAINTAINER suranyi suranyi.sysu@gmail.com

LABEL create_time=2020.9.5 jdk_version=1.8.0_261-b12

COPY jdk-8u261-linux-x64.tar /home/Java/

RUN tar -xf /home/Java/jdk-8u261-linux-x64.tar -C /home/Java/ \
    && rm /home/Java/jdk-8u261-linux-x64.tar

ENV PATH=/home/Java/jdk1.8.0_261/bin:$PATH

CMD java -version && bash

使用命令构建镜像 (如果文件名是标准的 Dockerfile)：

docker build -t oracle-jdk8 .

案例 2：构建基于 ubuntu 18.04 的 Anaconda3 环境

需要将 Dockerfile 与 Anaconda3-2020.07-Linux-x86_64.sh 放在同一目录下，Dockerfile 文件内容：

FROM ubuntu:18.04

MAINTAINER suranyi suranyi.sysu@gmail.com

COPY Anaconda3-2020.07-Linux-x86_64.sh /home/

ENV PATH=/home/anaconda3/bin:$PATH

RUN sh /home/Anaconda3-2020.07-Linux-x86_64.sh -b -p /home/anaconda3 \
    && rm /home/Anaconda3-2020.07-Linux-x86_64.sh \
    && conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ \
    && conda config --add channels bioconda \ 
    && conda config --add channels conda-forge \
    && conda update --all

使用命令构建镜像 (如果文件名是标准的 Dockerfile)：

docker build -t anaconda3 .

Dockerfile 语法

Dockerfile 是一个用于定制每一层所添加配置、文件的文本文件，其内包含了一条条的指令，每一条指令构建一层，因此每一条指令的内容，就是描述该层应当如何构建。

FROM 指定基础镜像（必备指令）：以一个镜像为基础，定制新的镜像。如果不需要基础镜像，可以使用 scratch，它表示一个空白镜像。对于 Linux 下静态编译的程序来说，并不需要操作系统提供运行时支持，所需的一切库都已经在可执行文件里了，因此直接 FROM scratch 会让镜像体积更加小巧。
MAINTAINER 维护者信息
LABEL 描述信息
RUN 执行命令：用来执行命令行命令，每一次的 RUN 会生成一份中间层镜像（注意，凡是相同指令的镜像，Docker 都不会重复构建，而是采用之前的缓存）。一般使用 \ && 分割不同的命令组，而不是为每一次命令写一次 RUN （会产生非常多臃肿的镜像中间层）。
apt-get 是最常见的指令，使用时需要注意：
1. 用户不应该升级使用 apt-get upgrade 批量升级包。它应该交由底层的镜像进行维护。如果需要升级某个特定的包，使用 apt-get install -y 包名。
2. RUN apt-get update 应该和 apt-get install 包名 -y 组合成一条语句。当 RUN apt-get update 单独作为一条语句时，其余镜像构建时相同的语句都会链接到最早构建的镜像，导致后续 apt-get install 包名 -y 使用的是旧版本的 apt-get。
3. 使用完成后，应该使用 apt-get clean 清除缓存包。官方的 Debian 和 Ubuntu 镜像会自动运行 apt-get clean，所以不需要显式的调用 apt-get clean。
COPY 拷贝文件：COPY [--chown=<user>:<group>] <源路径1> ... <源路径n> <目标路径> 。从构建上下文目录中 <源路径> 的文件或目录复制到新的一层的镜像内的 <目标路径> 位置（如果源路径为文件夹，复制的时候不是直接复制该文件夹，而是将文件夹中的内容复制到目标路径）。--chown=<user>:<group> 参数用于修改文件所属用户及所属组。
ADD 更高级的复制文件：用法与 COPY 一致，但是 ADD 会自动解压文件，使得镜像构建缓存失效，从而可能会令镜像构建变得比较缓慢。
CMD 容器启动命令：容器启动时，自动执行的指令。有两种格式
- CMD <命令> ：使用 shell 执行命令。例如：ubuntu 中默认的 CMD 是 /bin/bash，直接使用 docker run -it ubuntu 会进入 bash。
- CMD ["可执行文件", "参数1", "参数2"...]：使用 exec 执行。例如：在包含 anaconda3 的环境的中使用 CMD ["ipython"]，则启动该容器后会直接进入 ipython 环境。
  
  特别注意，容器不是虚拟机，它的所有程序都应该是前台运行的。诸如 CMD service nginx start 是 upstart 以守护进程形式启动 nginx 服务。但是它的主进程是 sh，命令结束后 sh 进程就结束了，容器就会退出。
  
  正确做法：CMD ["nginx", "-g", "daemon off;"]，以前台形式运行。
ENTRYPOINT 程序入口点：格式与 CMD 一致，Dockerfile 只允许有一个 ENTRYPOINT。将 CMD 改造为 <ENTRYPOINT> <CMD>，最佳用处是设置镜像的主命令，允许将镜像当成命令本身来运行（用 CMD 提供默认选项）。
```
# example: 如果没有传入参数，则执行 CMD 的 --help。

ENTRYPOINT ["s3cmd"]
CMD ["--help"]
```
ENV 设置环境变量： ENV <key> <value> 和 ENV <key1>=<value1> <key2>=<value2>...
VOLUME 定义匿名卷： VOLUME <路径> 和 VOLUME ["<路径1>", "<路径2>"...]。为了防止运行时用户忘记将动态文件所保存目录挂载为卷，可以在 Dockerfile 中事先指定某些目录挂载为匿名卷，这样在运行时如果用户不指定挂载，其应用也可以正常运行，不会向容器存储层写入大量数据。

VOLUME 指令不能挂载主机中指定的目录，这是为了保证 Dockerfile 的可一致性，因为不能保证所有的宿主机都有对应的目录。

VOLUME <路径> 指令并不是持续化挂载，它只能改变一层的挂载状态。实际使用时，一般将 VOLUME 写在最后 (可以在 CMD, ENTRYPOINT，不受入口指令影响)。
EXPOSE 暴露端口：EXPOSE <端口1> [<端口2>...]。EXPOSE 声明容器打算使用什么端口，并不会自动在宿主进行端口映射。映射端口需要使用 -p <宿主端口>:<容器端口>。
WORKDIR 指定工作目录：使用 RUN cd 路径 时，只会影响该中间层的内存变化，不会作用到下一层的 RUN。如果需要改变以后各层的工作目录的位置，那么应该使用 WORKDIR 指令。为便于阅读、排错、维护，应使用绝对路径。
USER 指定当前用户：与 WORKDIR 一样，会改变之后各层的执行用户。该用户需要事先建立。
```
# example
RUN groupadd -r redis && useradd -r -g redis redis
USER redis
RUN [ "redis-server" ]
```
ONBUILD 镜像触发器：特殊的指令，它后面跟的是其它指令，如 RUN, COPY 等。这些指令在当前镜像构建时并不会被执行。只有以当前镜像为基础镜像，去构建下一级镜像的时候才会被执行。

通过 Dockerfile 构建镜像

在 Dockerfile 文件所在的目录执行：

docker build -t <镜像名> .

如果 Dockfile 文件名为其他，则需要添加参数 -f 指定文件：

docker build -f <Dockerfile文件名> -t <镜像名> .

指令最后的 . 代表上下文环境，Docker 会发送上下文环境的数据用于构建镜像。如无必要，应当尽量使用只包含 Dockerfile 文件的目录（也可以将不需要的文件按行写入同级目录下 .dockerignore 文件中）。

如何理解指令中的"上下文环境"？

构建命令中最后的 `.` 代表上下文环境。Docker 在运行时分为 Docker 引擎（也就是服务端守护进程）和客户端工具。Docker 的引擎提供了一组 REST API，被称为 Docker Remote API，而如 docker 命令这样的客户端工具，则是通过这组 API 与 Docker 引擎交互，从而完成各种功能。因此，虽然表面上我们好像是在本机执行各种 docker 功能，但实际上，一切都是使用的远程调用形式在服务端（Docker 引擎）完成。也因为这种 C/S 设计，让我们操作远程服务器的 Docker 引擎变得轻而易举。

当我们进行镜像构建的时候，并非所有定制都会通过 RUN 指令完成，经常会需要将一些本地文件复制进镜像，比如通过 COPY 指令、ADD 指令等。而 docker build 命令构建镜像，其实并非在本地构建，而是在服务端，也就是 Docker 引擎中构建的。那么在这种客户端/服务端的架构中，如何才能让服务端获得本地文件呢？

这就引入了上下文的概念。当构建的时候，用户会指定构建镜像上下文的路径，docker build 命令得知这个路径后，会将路径下的所有内容打包，然后上传给 Docker 引擎。这样 Docker 引擎收到这个上下文包后，展开就会获得构建镜像所需的一切文件。

扩展：多阶段构建

Docker 希望最终的可执行文件放到一个最小的镜像（比如alpine）中去执行，怎样得到最终的编译好的文件呢？基于 Docker 的指导思想，我们需要在一个标准的容器中编译，比如在一个 Ubuntu 镜像中先安装编译的环境，然后编译，最后也在该容器中执行即可。

但是如果我们想把编译后的文件放置到 alpine 镜像中执行呢？我们就得通过 Ubuntu 镜像将编译完成的文件通过 cp容器ID:源路径目标路径 挂载主机上，然后我们再将这个文件挂载到 alpine 镜像中去。这种解决方案理论上肯定是可行的，但是这样的话在构建镜像的时候我们就得定义两步了：第一步是先用一个通用的镜像编译镜像，第二步是将编译后的文件复制到 alpine 镜像中执行，而且通用镜像编译后的文件在 alpine镜像中不一定能执行。

Docker 官方提供了一种多阶段构建的方法，在 COPY 中使用 --from= 参数声明之前的镜像，并将指定的数据导入到后续镜像中，从而生成精简的最小镜像。

# 先使用 golang 编译文件
FROM golang AS build-env
ADD . /go/src/app
WORKDIR /go/src/app
RUN go get -u -v github.com/kardianos/govendor
RUN govendor sync
RUN GOOS=linux GOARCH=386 go build -v -o /go/src/app/app-server

# 再将编译后的文件拷贝到 alpine 中
FROM alpine
RUN apk add -U tzdata
RUN ln -sf /usr/share/zoneinfo/Asia/Shanghai  /etc/localtime
COPY --from=build-env /go/src/app/app-server /usr/local/bin/app-server
EXPOSE 8080
CMD [ "app-server" ]

查看镜像构建记录

docker history <镜像 ID> [--no-trunc]

使用 --no-trunc 显示完成的命令构建过程。

导入与导出本地镜像

Docker 还提供了 docker save 和 docker load 命令，用以将镜像保存为一个文件，然后传输到另一个位置上，再加载进来。这是在没有 Docker Registry 时的做法，现在已经不推荐，镜像迁移应该直接使用 Docker Registry，无论是直接使用 Docker Hub 还是使用内网私有 Registry 都可以。

保存镜像：docker save 镜像ID -o 输出文件名.tar
保存镜像并压缩：docker save 镜像ID | gzip > 输出文件名.tar.gz
载入镜像：docker load -i 镜像存档名
通过网络传输镜像：docker save 镜像名 | gzip | pv | ssh <用户名>@<主机名> 'cat | docker load'

清除镜像缓存

docker 会缓存镜像构建中每一层的信息，在下一次构建时起到加速作用。但是，当中间层数据发生变动时，缓存机制则会导致构建出来的镜像及容器不是预期的数据文件，通过下列语句清除镜像缓存:

docker system prune --volumes

限制容器资源

默认情况下，容器是没有资源限制的，它会尽可能地使用宿主机能够分配给它的资源。Docker 提供了一种控制分配多少量的内存、CPU或阻塞I/O给一个容器的方式，即通过在docker run或docker create命令时设置运行时配置的标志。

限制 Docker 使用内存

在Docker中可以强行限制容器的资源使用的限制，即只允许容器使用不超过给定数量的系统内存或其他软限制。下面介绍几个最常用的选项，可以在docker run或docker create创建容器时指定，用以限制容器的资源使用限制。

选项	描述
-m 或 -memory=	容器可以使用的最大内存量。
--memory-swap	允许此容器交换到磁盘的内存量。
--kernel-memory	容器可以使用的最大内核内存量，允许的最小值是 4m（4MB）。由于内核内存无法换出，因此内核内存不足的容器可能会阻塞主机资源，这可能会对主机和其他容器产生副作用。

限制 Docker 使用CPU

默认情况下，每个容器对主机CPU周期的访问权限是不受限制的。我们可以设置各种约束来限制给定容器访问主机的CPU周期。大多数用户使用和配置CFS调度程序（默认）或实时调度程序。下面介绍几个常用的选项，用于配置默认的CFS调度程序，以限制容器对于CPU的使用。

选项	描述
`--cpus=<value>`	指定容器可以使用的可用CPU资源量，例如宿主机有4个CPU，那你可以给容器设置--cpus="3.5"，则限制容器最多使用3.5个CPU。
--cpuset-cpus	限制容器可以使用的特定CPU或核心，例如宿主机有4个CPU，那你可以给容器设置--cpuset-cpus="1,3"，则限制容器只能使用第2个和第4个CPU。

限制 Docker 使用磁盘

相对于CPU和内存的配额控制，docker对磁盘IO的控制相对不成熟，大多数都必须在有宿主机设备的情况下使用。主要包括以下参数：

–device-read-bps：限制此设备上的读速度（bytes per second），单位可以是kb、mb或者gb。
–device-read-iops：通过每秒读IO次数来限制指定设备的读速度。
–device-write-bps ：限制此设备上的写速度（bytes per second），单位可以是kb、mb或者gb。
–device-write-iops：通过每秒写IO次数来限制指定设备的写速度。
–blkio-weight：容器默认磁盘IO的加权值，有效值范围为10-100。
–blkio-weight-device：针对特定设备的IO加权控制。其格式为DEVICE_NAME:WEIGHT

操作容器

启动容器有两种方式，一种是基于镜像新建一个容器并启动，另外一个是将在终止状态（stopped）的容器重新启动。因为 Docker 的容器实在太轻量级了，很多时候用户都是随时删除和新创建容器。

创建并启动

直接使用 docker run 镜像名 可以创建一个容器，该容器结束后不会删除。一般会使用：

docker run -it --rm 镜像名

-it 表示进入交互式终端，--rm 表示结束后删除容器。还可以使用 --name 容器名 设置容器名。
如果需要 Docker 在后台运行而不是直接把执行命令的结果输出在当前宿主机下，可以通过添加 -d 参数来实现（守护态运行）。进入守护态的容器可以使用 docker exec -it 容器名 bash 进入。
使用 -P 标记时，Docker 会随机映射一个端口到内部容器开放的网络端口；使用 -p hostPort:containerPort将主机端口映射到容器端口，类似的还有 ip:hostPort:containerPort 和 ip::containerPort （指定地址的任意端口映射到容器端口）。
-m 10g: 设置该容器最多使用的内存量；
--cpus=2: 设置该容器最多使用的 CPU 核心数；

其他操作

查看容器：docker container ls，显示当前正在运行的容器。添加 -a 参数显示所有容器。
启动已终止的容器：docker container start
删除容器：docker container rm <容器ID/容器名> <容器ID/容器名> ...
删除所有已终止的容器：docker container prune
终止容器：docker stop ID
导出容器：docker export ID > 输出文件名.tar
导入容器为镜像：cat 容器存档名 | docker import - 镜像名，容器快照文件将丢弃所有的历史记录和元数据信息，从容器快照文件导入时可以重新指定标签等元数据信息。docker load -i 镜像存档名 将保存完整记录
拷贝容器中的数据到本地：docker cp 容器ID:源路径目标路径

容器互联

创建一个 Docker 网络，实现多个容器之间的相互连接：

docker network create -d bridge 网络名

-d 参数指定 Docker 网络类型，有 bridge、overlay。在运行容器时，使用 --network 网络名 连接到指定的网络。

挂载数据

[!NOTE|label:--mount 还是 -v]

如果需要指定卷驱动程序选项，则必须使用--mount。

-v或--volume：由三个字段组成，以冒号 (:) 分隔。这些字段必须以正确的顺序排列，并且每个字段的含义并不直观。

对于命名卷，第一个字段是卷的名称，在给定的主机上是唯一的。对于匿名卷，将省略第一个字段。

第二个字段是文件或目录在容器中的挂载路径。

第三个字段是可选的，并且是逗号分隔的选项列表，例如ro。这些选项将在下面讨论。

--mount：由多个键/值对组成，用逗号分隔，每对均由一个 <key>=<value> 组成。

挂载的type，可以是bind，volume或tmpfs。

挂载的source。对于命名卷，这是卷的名称。对于匿名卷，将省略此字段。可以指定为source或src。

destination表示文件或目录在容器中的挂载路径。可以指定为destination，dst或target。

readonly选项（如果存在）使绑定挂载以只读方式挂载到容器中。

volume-opt选项，可以多次指定，由选项名称及其值组成的键值对。

挂载主机路径

挂载主机目录/文件虽然可以实现容器访问主机文件，但其本质上是通过服务器发送文件实现的，对 IO 性能有一定影响。

简单的挂载指令为：-v [宿主机路径]:[容器路径]，默认权限为读写。

挂载主机目录

在创建一个容器时，使用 --mount 标记可以指定挂载一个本地主机的目录到容器中去：

--mount type=bind,source=/src/webapp,target=/usr/share/nginx/html

Docker 挂载主机目录的默认权限是读写，用户也可以通过增加 readonly 指定为只读：

--mount type=bind,source=/src/webapp,target=/usr/share/nginx/html,readonly

注意：这里的 source、target 都必须是 ==绝对路径==，各个键值对中也不能有空格！

挂载主机文件

挂载主机文件和目录的操作一样：

--mount type=bind,source=$HOME/.bash_history,target=/root/.bash_history

挂载多个分散文件时，可以重复写多个 --mount 语句。

挂载数据卷

数据卷是一个可供一个或多个容器使用的特殊目录，它绕过 UFS，可以提供很多有用的特性：数据卷可以在容器之间共享和重用；对数据卷的修改会立马生效；对数据卷的更新，不会影响镜像；数据卷默认会一直存在，即使容器被删除。数据卷的使用，类似于 Linux 下对目录或文件进行 mount，镜像中的被指定为挂载点的目录中的文件会复制到数据卷中（仅数据卷为空时会复制）。

[!TIP|label:IO密集型任务建议使用挂载数据卷]

当您的应用程序在Docker Desktop上需要高性能I/O时。卷存储在Linux虚拟机中，而不是主机中，这意味着读写具有更低的延迟和更高的吞吐量

创建数据卷： docker volume create 数据卷名
查看所有数据卷：docker volume ls
查看指定数据卷的信息：docker volume inspect 数据卷名
启动一个挂载数据卷的容器：在启动容器的 run 指令中，--mount type=volume,source=数据卷名,target=/usr/share/
删除数据卷：docker volume rm 数据卷名
批量删除无效数据卷：docker volume prune
查看数据卷的具体信息： docker inspect 容器ID ，数据卷的信息记录在 "Mounts" 下

案例

使用 Docker 自动化部署 JavaGBC 测试环境

(1) 文件架构

project
├─ .history: 历史版本
├─ test: 测试数据及工具
│   ├─ Dockerfile_javagbc_compare_env: 其他工具测试环境的 Dockerfile 文件
│   ├─ data: 测试数据 (约 27.62 GB)
│   └─ .dockerignore: 测试数据不作为上下文的内容，而是直接挂载到主机目录
├─ JavaGBC: JavaGBC 源码
└─ JavaGBC.jar: JavaGBC 可执行 jar 包

(2) Dockerfile 文件

Dockerfile_javagbc_compare_env 文件内容如下：

FROM ubuntu:18.04

MAINTAINER suranyi suranyi.sysu@gmail.com

RUN apt-get update && apt-get install python3 -y \
    && apt-get --yes install build-essential git cmake wget libcurl4-gnutls-dev zlibc zlib1g zlib1g-dev libbz2-dev liblzma-dev \
    && cd /home \
    && git clone https://github.com/refresh-bio/GTShark.git gtshark \
    && git clone https://github.com/refresh-bio/GTC.git gtc \
    && git clone https://github.com/samtools/htslib.git htslib \
    && git clone https://github.com/richarddurbin/pbwt pbwt \
    && git clone https://github.com/lh3/bgt.git bgt \
    && cd /home/gtshark && ./install.sh && make \
    && cd /home/gtc && ./install.sh && make \
    && cd /home/htslib && make \
    && cd /home/pbwt && make \
    && cd /home/bgt && make

ENV PATH=/home/bgt:/home/pbwt:home/gtc:/home/gtshark:/home/htslib:$PATH

(3) .dockerignore 文件

./data/

(4) 构建镜像

cd /project/test
docker build -f Dockerfile_javagbc_compare_env -t javagbc_compare_env .

(5) 创建容器并挂载数据

docker run -it --rm --mount type=bind,source=/project/data,target=/mnt/,readonly javagbc_compare_env

使用 Docker 搭建可以调整 JVM 运行参数的运行环境

Dockerfile 文件如下：

FROM bellsoft/liberica-openjdk-alpine:17

MAINTAINER suranyi suranyi.sysu@gmail.com

ENV JAVA_OPTS="-Xms4g -Xmx4g"

RUN echo "java \$JAVA_OPTS -jar \$@" > /setup.sh

ENTRYPOINT ["/bin/sh", "/setup.sh"]

启动时，通过参数 -e JAVA_OPTS="-Xms4g -Xmx4g" 控制 JVM 的启动参数。

# Macos 或 Linux
docker run -v `pwd`:`pwd` -w `pwd` --rm -it -e JAVA_OPTS="-Xms4g -Xmx4g" [image] [options]

# Windows
docker run -v %cd%:%cd% -w %cd% --rm -it -e JAVA_OPTS="-Xms4g -Xmx4g" [image] [options]

搭建仅运行 Java 程序的运行环境

Dockerfile 文件如下：

FROM bellsoft/liberica-openjdk-alpine:17

MAINTAINER suranyi suranyi.sysu@gmail.com

LABEL create_time=2022.06.15

RUN wget http://pmglab.top/gbc/download/gbc.jar -O /gbc.jar

ENTRYPOINT ["java", "-XshowSettings:vm", "-XX:InitialRAMPercentage=100", "-XX:MaxRAMPercentage=100", "-jar", "/gbc.jar"]

输入时，通过参数 -m 4g 控制堆内存大小，JVM 会自动使用全部的堆内存。

Docker 简介

Docker 简介

基本概念

镜像

容器

仓库

安装 Docker

使用镜像

从镜像仓库拉取镜像

查看本地镜像

删除镜像

定制镜像

扩展：多阶段构建

查看镜像构建记录

导入与导出本地镜像

清除镜像缓存

限制容器资源

限制 Docker 使用内存

限制 Docker 使用CPU

限制 Docker 使用磁盘

操作容器

创建并启动

其他操作

容器互联

挂载数据

挂载主机路径

挂载数据卷

案例

使用 Docker 自动化部署 JavaGBC 测试环境

使用 Docker 搭建可以调整 JVM 运行参数的运行环境

搭建仅运行 Java 程序的运行环境

results matching ""

No results matching ""