天天看点

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

作者:CSDN

【CSDN 编者按】使用 pex 使我们能够在 Docker 之上建立一个可重复的、一致的环境,我们很高兴使用这个 pex-on-docker 组合来探索其他的可能性。

原文链接:https://dagster.io/blog/fast-deploys-with-pex-and-docker

未经允许,禁止转载

作者 | Shalabh Chaturvedi译者 | 邓晓娟 责编 | 王子彧出品 | CSDN(ID:CSDNnews)

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

无服务器开发和反馈循环

Dagster 是一个数据编排器。在无服务器 Dagster 云上,不需要建立本地开发环境或云基础设施,就可以开发和部署 Dagster 代码。当你向 GitHub 提交修改时,GitHub Action 会直接构建和部署你的代码到 Dagster 云。你可以在用户界面中查看和互动你的 Dagster 对象。借助 Dagster 云,远程环境通常用于让使用自动创建的暂存环境与合作者共享部署。个人本地开发和共享远程环境相结合,形成了一个强大的开发周期。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

最初,我们在这上面使用了基于 Docker 的标准构建流程。然而我们很快发现,这让编辑-部署-运行的周期变得非常繁琐缓慢。为了加快速度,我们构建了一个系统,实现在 Docker 镜像之外运送代码。这篇文章描述了我们分析的问题、确定的解决方案,以及在这个过程中做出的各种权衡。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

Shalabh Chaturvedi 分享了 Dagster Cloud 新的快速部署能力的高水平概述,详情请观看视频:https://youtu.be/mPT3FBFSw6g

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

Docker镜像的问题

当我们在 GitHub 上构建 Docker 镜像并将其部署到 Dagster 云时,每次提交都需要3到5分钟才能在 Dagster 用户界面上显示出来。无服务器开发人员通常会在每次迭代中对代码进行小的改动,但却每次都要等待3分钟以上才能看到改动的效果,这种无意义的等待很容易让人厌烦。我们分析了一个问题:“当你修改一行代码并提交后,会发生什么?”发现了以下的情况。

我们分析了 "当你改变一行代码并提交时会发生什么",发现了以下情况。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!
  • 20s > 提供 GitHub 运行器并下载动作
  • 10s > 下载基于 Docker 的行动
  • 60s > 建立并上传用户的 Docker 镜像*。
  • 90s > 在 AWS 中运行用户的 Docker 镜像
  • 180s的运行时间

* 在启用缓存的情况下需要60秒(如果没有改变依赖关系的话);如果依赖关系有变化,则需要90秒以上。

如你所见,花费时间最长的两件事是:

  • 构建一个 Docker 镜像(60-90多秒)
  • 部署 Docker 容器(90秒)

那就让我们来看看这两件事都做了些什么。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

构建 Docker 镜像

关于构建 Docker 镜像需要注意的一些事情。

  1. Docker 镜像是由堆栈中的多个层堆叠而成的,其中每一层都是由 Docker 文件中的一个命令子集构建的;
  2. 每一层都由一个哈希值来识别;
  3. 当上传镜像到注册表时,只有不存在于注册表中的层(由哈希值识别)被上传;
  4. 使用 GitHub Actions 缓存在 GitHub 构建机上重建镜像时,会将所有未受影响的层从缓存中拉到构建机上。请注意,如果你的项目中有大量的依赖关系没有改变,它们会在构建过程中从缓存中一起被复制到构建机器上;
  5. Docker 的构建不是确定性的。如果你用完全相同的内容构建一个镜像两次,每次都可能产生不同的哈希值。(虽然不直接相关,但我们想记录一下这个意外的观察结果。作为一个极端案例,考虑到一个新构建的大层与已经在注册表中的层相同,仍然可能作为一个新的层被上传)。
从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

启动 Docker 容器

关于启动 Docker 容器需要注意的是,我们使用 AWS Fargate,它需要45到90秒的时间来配置和启动一个镜像。且不提供任何图像缓存。启动一个新的容器会从注册表中下载所有的层到配置的容器上。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

其他限制

在 Docker 镜像建立和启动后,我们运行用户的代码来提取元数据,显示在用户界面上。这一步无法避免,可能需要几秒钟到30秒,甚至更久,这取决于元数据的计算方式(比如它可以连接到数据库来读取模式)。这个代码服务器保持活动状态,为元数据请求提供服务,直到推送新版本的代码,然后启动一个新的容器。

我们的一个关键要求是可重复性:我们需要能够多次重新部署完全相同的代码和环境。使用 Docker 镜像的哈希值作为代码和环境的标识符,可以很好地满足这一要求。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

备选方案综述

除了上述的方案以外,我们还探索和讨论了一些替代方案。

  1. 从 Fargate 切换到 EC2,以加快容器的启动。这将增加我们的运营负担,要求我们预先提供、监控和扩展我们的集群。我们仍然会遇到 Docker 构建缓慢的问题;
  2. 换成不同的 Docker 构建系统,如 AWS CodeBuild。这将需要更多的部署工作,并与 GitHub 进行更深入的整合。目前还不清楚这样做的回报是否值得;
  3. 切换到 AWS Lambda,启动时间快得多。Lambda 环境有自己的基础镜像,对于自定义需求来说不太友好。而且它的执行时间还有15分钟的限制,这对运行时间较长的服务器来说,需要复杂的变通方法;
  4. 通过构建并只上传修改后的代码到同一服务器,重新使用长期运行的代码服务器。这里的挑战是实现打包和运行机制,以确保一个可靠和可重复的执行环境。我们研究了各种打包和分发 Python 环境的方法,包括 rsync、poetry、nix、shiv 和 pex。还考虑了使用 EFS卷来挂载Python环境,与这些工具相结合。

我们作出最终决定背后的有一个关键因素,是意识到虽然 Docker 镜像是行业标准,但如果我们只需要同步一个小的变化时,就去移动100多兆的镜像,是很不必要的繁重操作。考虑到 Git 只提供差异,但却能产生完整而一致的存储库。因此我们倾向于方案4,只需要能找到一个合适的工具来做大部分的工作。经过一些实验,我们发现 pex 的许多功能对我们的用例非常有效。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

什么是 PEX?

pex 是 Python Executable 的缩写,它是一种将 Python 包捆绑到称为 pex 文件的工具。这些是可执行文件,其中包含 Python 包和一些引导代码。例如,我们可以把 dagster 包和它的依赖项捆绑成一个文件,然后运行它。

% pex dagster --python=python3.8 -o dagster.pex              % ./dagster.pex              Python 3.8.16 (default, Dec 7 2022, 01:24:57)              [Clang 14.0.0 (clang-1400.0.29.202)] on darwin              Type "help", "copyright", "credits" or "license" for more information.              (InteractiveConsole)              >>> import dagster              >>>           

将整个环境放在一个文件中,便于运输和存储在 S3 中。pex 提供的不仅仅是一个 "文件中的虚拟环境",以下是我们使用的其他功能。

  1. 隔离

在运行时,pex 环境与其他网站范围内的包完全隔离。环境中唯一存在的包是那些捆绑在 pex 文件中的包。我们将多个 pex 文件运送到同一台机器上,而不必担心环境隔离问题。

  1. 确定性

使用相同的输入包会产生位对位的相同的 pex 文件。

$ pex dagster pandas -o out.pex | sha256sum              e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855 -              $ pex dagster pandas -o out.pex | sha256sum              e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855 -           

这让我们有信心用内容寻址来识别这些 pex 文件。为了实现可重复性,除了Docker 镜像的哈希值,还使用 pex 文件哈希值。

  1. 组成

多个 pex 文件可以在运行时合并,有效地将环境合并成一个。

% pex pandas -o pandas.pex              % pex dagster -o dagster.pex              % PEX_PATH=pandas.pex ./dagster.pex              Python 3.8.16 (default, Dec 7 2022, 01:24:57)              [Clang 14.0.0 (clang-1400.0.29.202)] on darwin              Type "help", "copyright", "credits" or "license" for more information.              (InteractiveConsole)              >>> import pandas              >>> import dagster              >>>           

我们用它把代码分成两部分,在运行时合并:一个包含所有依赖关系的 deps.pex 文件和一个只包含用户代码的 source.pex 文件。

  1. 跨平台的构建

我们在无服务器云中使用 Linux python :*-slim 衍生的基础镜像。只要软件包的轮子可用, pex 工具可以在任何平台上为 Linux 构建 pex 文件。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

快速部署

我们使用 pex 与 S3 相结合来存储 pex 文件,建立了一个系统,其中快速路径避免了构建和启动 Docker 镜像的开销。

我们的系统是这样工作的:当你向 GitHub 提交代码时,GitHub Action 要么进行完全构建,要么进行快速构建,这取决于你的依赖关系自上次部署后是否有变化。我们跟踪 setup.py 和 requirements.txt 中指定的依赖项。

对于一个完整的构建,将项目依赖性构建到 deps.pex 文件,将代码构建到 source.pex 文件。两者都被上传到 Dagster 云端。对于快速构建,只构建和上传 source.pex 文件。

在 Dagster 云中,可以重新使用一个现有的容器或提供一个新的容器作为代码服务器。将 deps.pex 和 source.pex 文件下载到这个代码服务器上,并使用它们在一个隔离的环境中运行代码。我们从不在用户之间共享一个容器,一个容器上的所有环境都属于同一个用户。快速部署的最佳情况和最坏情况的时间线如下。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

其结果是,在快速构建(Fast Build)的路径中,当我们进行快速构建并重用现有容器时,整个过程只需40秒,而不像以前一样需要3分钟以上。

我们将这一功能称为【快速部署】,现在所有新注册的无服务器用户都默认开启这一功能。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

权衡与问题

快速部署极大地提高了部署速度(4-5倍),但它伴随着一些需要权衡的问题和其他因素,我们已经进行了调整:

  1. 虽然我们现在可以在一个代码服务器上运行多个环境,并且它们在代码上是隔离的,但它们仍然共享相同的内存和 CPU。如果我们在一个容器上放了太多的环境,而且一个环境占用了太多的内存,就会对同一容器中的其他运行环境产生不利的影响;
  2. Docker 可以在任何操作系统上为 Linux 构建 Python 包,因为目标 Linux 操作系统和 Python 解释器在构建过程中是可用的。pex 只能为 Linux 构建提供轮子的包的 pex 文件。作为退路,我们在构建过程中使用 Docker 容器来处理源码分发。这个步骤可以在未来被移到一个单独的共享服务中;
  3. 在构建 Docker 镜像时,可以进行深度定制,例如,你可以指定一个自定义的基础镜像,而不是默认的 python :*-slim 镜像之一。为了实现功能上的平等,我们必须实施一种方法,让用户指定他们自己的基础 Docker 镜像,我们在快速部署时使用这种镜像。
从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

GitHub 工作流程和 pex

很多人可能已经注意到,原图中,过去基于 Docker 的下载操作需要10秒左右。那么我们是如何完全消除这个步骤的呢?

以前我们把 GitHub Action 代码打包成 Docker 镜像,然后使用 Docker 容器操作。而现在,我们把动作代码打包成一个 pex 文件,将其检入动作仓库,直接在 GitHub 运行器上运行。这就省去了下载和启动 Docker 动作镜像的时间,同时仍然允许我们打包所有的依赖项。

我们做的另一个小优化是,只使用一个 GitHub 工作流作业。在 GitHub 中的每一个工作启动都需要10秒钟来配置一个新的运行器。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!

结论

将部署时间从 3 分钟以上减少到 40 秒,是一个显著的加速,我们对这个结果非常满意,特别是当测试自己的服务时。使用 pex 使我们能够在 Docker 之上建立一个可重复的、一致的环境,我们很高兴使用这个 pex-on-docker 组合来探索其他的可能性。

从 3 分以上到 40 秒,Docker 容器 5 倍速度部署实战!