博客
关于我
一次 Docker 镜像的逆向工程 | Linux 中国
阅读量:310 次
发布时间:2019-03-03

本文共 1818 字,大约阅读时间需要 6 分钟。

Docker 镜像的结构揭秘:如何从镜像中提取构建信息

在我们的项目中,经常需要处理一些与 Docker 镜像相关的技术问题。一次典型的案例是,我们需要重新构建一个遗失的 Docker 镜像。这个镜像最初是由外包开发人员构建的,但他没有提交原始的 Dockerfile。面对这一挑战,我们决定从镜像文件中提取尽可能多的信息。

Docker 镜像的格式其实非常透明。只要对镜像文件进行解析,我们就可以揭开许多谜团。以下将详细介绍我们是如何从镜像中提取构建信息的。

第一步:提取镜像文件

首先,我们需要将 Docker 镜像保存到本地文件中。可以通过以下命令实现:

docker pull tmknom/prettier:2.0.5docker save tmknom/prettier:2.0.5 > prettier.tar

这个文件是一个典型的 tarball 形式,包含镜像的所有构建信息。接下来,我们可以解压这个 tarball 文件来进一步分析。

第二步:解析镜像文件

解压后的文件结构看起来像是一个层级性的目录树。每个子目录都对应镜像中的一层。例如,以下是解压后的部分内容:

6c37da2ee7de579a0bf5495df32ba3e7807b0a42e2a02779206d165f55f1ba70/layer.tard4f612de5397f1fc91272cfbad245b89eac8fa4ad9f0fc10a40ffbb54a356cb4/layer.tara9cc4ace48cd792ef888ade20810f82f6c24aaf2436f30337a2a712cd054dc97/layer.tar

每个层都有一个唯一的哈希值,这使得我们能够精确追踪每一层的构建信息。

第三步:分析构建历史

镜像的构建历史记录在 history 文件中。这个文件详细列出了镜像的每一层及其构建时间。例如:

{  "created": "2020-04-24T01:05:03.608058404Z",  "created_by": "/bin/sh -c #(nop) ADD file:b91adb67b670d3a6ff9463e48b7def903ed516be66fc4282d22c53e41512be49 in / "},{  "created": "2020-04-24T01:05:03.92860976Z",  "created_by": "/bin/sh -c #(nop)  CMD [\"/bin/sh\"]",  "empty_layer": true},...

从这些信息中,我们可以看到镜像的构建时间和构建命令。这对于重建镜像非常有帮助。

第四步:重建 Dockerfile

通过分析镜像的构建历史,我们可以大致重建原始的 Dockerfile。例如,以下是从镜像中提取的一部分构建信息:

FROM alpine:3.11.6WORKDIR /workENTRYPOINT /usr/bin/prettierCMD --help

这些信息帮助我们了解镜像的基础构建环境。通过进一步分析,我们可以发现镜像主要基于 Alpine 系统,并包含了一系列与 Node.js 和 Prettier 相关的依赖项。

第五步:验证镜像的合理性

在分析镜像的构建信息的过程中,我们发现镜像中包含了多个非空层。例如:

  • 基础系统镜像
  • Prettier 安装所需的依赖项
  • 工作目录的定义
  • 通过对这些层的进一步分析,我们可以验证镜像的合理性。例如,基础镜像确实包含了必要的系统工具,而 Prettier 镜像则包含了所有相关的安装脚本和依赖项。

    第六步:总结经验

    通过这一系列的分析和重建过程,我们得出了以下几个关键结论:

  • Docker 镜像的构建过程可以通过镜像文件的解析来追溯
  • 镜像的构建信息可以通过 history 文件和各层的 tarball 文件来提取
  • 即使没有原始的 Dockerfile,我们仍然可以通过镜像文件重建出一个基本的构建流程
  • 在实际项目中,建立一个清晰的镜像构建记录是至关重要的
  • 结语

    通过对 Docker 镜像的深入分析,我们不仅能够理解镜像的构建过程,还可以利用这些信息来优化和重建镜像。虽然这需要一定的技术门径,但对于需要维护和扩展现有镜像的项目来说,这无疑是一个非常有价值的能力。

    转载地址:http://swxl.baihongyu.com/

    你可能感兴趣的文章
    php pcntl 多进程学习
    查看>>
    PHP pcntl_fork不能在web服务器中使用的变通方法
    查看>>
    php private ,public protected三者的区别
    查看>>
    php PSR规范
    查看>>
    php rand() 重复,array_rand()函数从另外一个数组中随机取得的一定数量的数组的元素是否会重复?...
    查看>>
    php redis pub/sub(Publish/Subscribe,发布/订阅的信息系统)之基本使用
    查看>>
    php redis 集群扩展类文件
    查看>>
    php redis(2)
    查看>>
    PHP Redis分布式锁
    查看>>
    php redis的应用
    查看>>
    php rss,如何用PHP编写RSS
    查看>>
    php session超时时间_php怎么设置session超时时间
    查看>>
    PHP SOAP模块的使用方法:NON-WSDL模式
    查看>>
    PHP Socket实现websocket(三)Stream函数
    查看>>
    php Socket通信
    查看>>
    PHP SPL标准库-迭代器
    查看>>
    php static 变量
    查看>>
    PHP Static延迟静态绑定
    查看>>
    php str_pad();
    查看>>
    PHP study 环境变量composer
    查看>>