当前位置:   article > 正文

Docker学习(9)——Dockerfile构建镜像的几种优化方案的详细说明_容器镜像构建优化方案

容器镜像构建优化方案

参考了来自51CTO博客作者aaron428的原创作品

1.为什么要做镜像优化?

随着我们对docker镜像的持续使用,在此过程中如果不加以注意并且优化,镜像的体积会越来越大
很多时候我们在使用docker部署应用时,会发现镜像的体积至少有1G以上
镜像体积的增大,不单单会增加磁盘资源与网络资源的开销,也会影响应用的部署效率,使得应用的部署时间会越来越长
因此我们需要减少部署镜像的体积以加快部署效率,降低资源的开销
而对于镜像的优化,可以通过对dockerfile的优化来实现

2.构建镜像的几个原则

(1)镜像最小化原则

选择最精简的基础镜像
选择体积最小的基础镜像可有效降低镜像体积。如:alpine、busybox等

清理镜像构建的中间产物
构建镜像的过程中,当dockerfile的指令执行完成后,删除镜像不需要用的的文件。
如使用yum安装组件,最后可使用yum clean all镜像清理不需要的文件或者使用系统rm命令删除不需要的源文件等。

减少镜像的层数
镜像是一个分层存储的文件,并且镜像对层数也是有一定数量的限制,当前镜像的层数最高是127层,
如果不多加注意,将会导致镜像越来越臃肿。
在使用dockerfile构建镜像时,dockerfile中的每一条指令都会生成一个层,
因此可以通过合并dockerfile中可合并的指令,减少最终生成镜像的层数。
例如:在dockerfile中使用RUN执行shell命令是,可以用"&&"将多条命令连接起来。

(2)构建速度最快化原则

充分利用镜像构建缓存
我们可以利用构建的缓存来加快镜像构建速度,Docker构建默认会开启缓存,缓存生效有三个关键点,
镜像父层没有发生变化,构建指令不变,添加文件校验和一致。
只要一个构建指令满足这三个条件,这一层镜像构建就不会再执行,它会直接利用之前构建的结果。
某一层的镜像缓存失效之后,它之后的镜像层缓存都会失效。
我们应该把变化最少的部分放在Dockerfile的前面,这样可以充分利用镜像缓存。
dockerfile中有可能导致缓存失效的命令WORKDIR、CMD、ENV、ADD等,
像这些命令最好放到dockerfile底部,以便在构建镜像过程中最大限度使用缓存。

删除构建目录中(默认:Dockerfile所在目录)不需要用的的文件
编写.dockerignore文件过滤构建过程中不必要的文件或者创建单独的目录,并且目录中仅存在镜像构建过程中需要使用的文件。
Docker 在运行时分为 Docker 引擎(也就是服务端守护进程)和客户端工具。
Docker 的引擎提供了一组 REST API,被称为 Docker Remote API,
而如 docker 命令这样的客户端工具,则是通过这组 API 与 Docker 引擎交互,从而完成各种功能。
因此,虽然表面上我们好像是在本机执行各种 docker 功能,但实际上,一切都是使用的远程调用形式在服务端(Docker 引擎)完成。docker build 命令构建镜像,其实并非在本地构建,而是在服务端,也就是 Docker 引擎中构建的。
构建镜像时,Docker需要先准备context ,将所有需要的文件收集到进程中。
默认的context包含Dockerfile目录中的所有文件。
如果目录中的存在大量不相关的文件,不仅会导致构建缓慢,而且还会导致镜像体积增大。

.dockerignore示例如下:
在一个git项目中,我们并不需要.git目录等内容。可以在.dockerignore文件中加入以下内容:
.git/
.dockerignore 的作用和语法类似于 .gitignore,可以忽略一些不需要的文件,
这样可以有效加快镜像构建时间,同时减少Docker镜像的大小。
  • 1
  • 2
  • 3
  • 4
  • 5

(3)注意优化网络请求

我们使用一些镜像源或者在dockerfile中使用互联网上的url时,
去用一些网络比较好的开源站点,这样可以节约时间、减少失败率

3.dockerfile指令优化

  • (1)COPY指令和ADD指令的区别
COPY 复制文件
格式:
COPY <源路径>... <目标路径>
COPY ["<源路径1>",... "<目标路径>"]
COPY 指令将从构建上下文目录中 <源路径> 的文件/目录复制到新的一层的镜像内的 <目标路径> 位置。比如:
COPY package.json /usr/src/app/
<源路径> 可以是多个,甚至可以是通配符,其通配符规则要满足 Go 的 filepath.Match 规则,如:
COPY hom* /mydir/
COPY hom?.txt /mydir/
<目标路径> 可以是容器内的绝对路径,也可以是相对于工作目录的相对路径(工作目录可以用 WORKDIR 指令来指定)。
目标路径不需要事先创建,如果目录不存在会在复制文件前先行创建缺失目录。
此外,还需要注意一点,使用 COPY 指令,源文件的各种元数据都会保留。比如读、写、执行权限、文件变更时间等。这个特性对于镜像定制很有用。
特别是构建相关文件都在使用 Git 进行管理的时候。
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

ADD 更高级的复制文件

ADD 指令和 COPY 的格式和性质基本一致。但是在 COPY 基础上增加了一些功能。
比如 <源路径> 可以是一个 URL,这种情况下,Docker 引擎会试图去下载这个链接的文件放到 <目标路径> 去。
下载后的文件权限自动设置为 600,如果这并不是想要的权限,那么还需要增加额外的一层 RUN进行权限调整,
另外,如果下载的是个压缩包,需要解压缩,也一样还需要额外的一层 RUN 指令进行解压缩。
所以不如直接使用 RUN 指令,然后使用 wget 或者 curl 工具下载,处理权限、解压缩、然后清理无用文件更合理。
因此,这个功能其实并不实用,而且不推荐使用。
如果 <源路径> 为一个 tar 压缩文件的话,压缩格式为 gzip, bzip2 以及 xz 的情况下,
ADD 指令将会自动解压缩这个压缩文件到 <目标路径> 去。
在某些情况下,这个自动解压缩的功能非常有用,比如官方镜像 ubuntu 中:
FROM scratch
ADD ubuntu-xenial-core-cloudimg-amd64-root.tar.gz /
但在某些情况下,如果我们真的是希望复制个压缩文件进去,而不解压缩,这时就不可以使用 ADD 命令了。

在 Docker 官方的最佳实践文档中要求,尽可能的使用 COPY,因为 COPY 的语义很明确,就是复制文件而已,
而 ADD 则包含了更复杂的功能,其行为也不一定很清晰。最适合使用 ADD 的场合,就

声明:本文内容由网友自发贡献,转载请注明出处:【wpsshop博客】
推荐阅读
相关标签
  

闽ICP备14008679号