天天看点

基于Docker的Tensorflow实验环境

基于Docker的Tensorflow实验环境

本系列将利用docker和阿里云容器服务,帮助您上手tensorflow的机器学习方案

第一篇 打造tensorflow的实验环境 - 本文

机器学习作为人工智能重要的技术,已经在计算机视觉、自然语言处理、医学诊断等等领域得到了广泛的应用。tensorflow 是谷歌推出的开源的分布式机器学习框架,它也是github社区上最受关注的机器学习项目,目前点赞已经超过3万个星。

本文是系列中的第一篇文章,会基于docker快速创建一个tensorflow学习环境。

为了利用docker和docker compose编排搭建实验环境,我们需要

首先执行如下命令获得教程代码 (包含对tensorflow 1.0 的支持)

为了运行这个教程你需要安装tensorflow的执行环境,并配置"jupyter", "tensorboard"来进行交互操作。

一个最简单的方法是在当前目录,创建如下的<code>docker-compose.yml</code>模板

执行如下命令一键创建tensorflow的学习环境

我们可以检查启动的docker容器

登录密码为: tensorflow

基于Docker的Tensorflow实验环境
基于Docker的Tensorflow实验环境

注:

其中<code>registry.cn-hangzhou.aliyuncs.com/denverdino/tensorflow:1.0.0</code>是基于<code>tensorflow/tensorflow:1.0.0</code>镜像构建的,只添加了apt源和pipy源的阿里云镜像。 大家也可以参照<code>https://github.com/denverdino/tensorflow-docker</code>中的dockerfile自己构建,预先添加自己所需的python库、算法库等资源。

利用volumes机制,jupyter可以直接从当前notebooks目录获取示例。jupyter和tensorboard两个容器也通过可以文件卷来共享事件日志。

阿里云容器服务支持docker compose模板部署,通过下面模板我们可以轻松把tensorflow的学习环境部署到云端

利用<code>aliyun.routing</code>标签,我们可以轻松定义jupyter和tensorboard的访问访问端点

如果是老集群,需要点击容器服务agent升级来提供所需特性和稳定性增强。

几分钟之后,我们就可以在云端有一个学习环境来体验tensorflow。

基于Docker的Tensorflow实验环境
基于Docker的Tensorflow实验环境
基于Docker的Tensorflow实验环境
基于Docker的Tensorflow实验环境

我们可以利用docker和阿里云容器服务轻松在本地和云端搭建tensorflow的学习环境。docker作为一个标准化的软件交付手段,可以大大简化应用软件的部署和运维复杂度。阿里云容器服务支持以docker compose的方式进行容器编排,并提供了众多扩展,可以方便地支持基于容器的微服务应用的云端部署和管理。

阿里云容器服务还会和高性能计算(hpc)团队一起配合,之后在阿里云上提供结合gpu加速和docker集群管理的机器学习解决方案,在云端提升机器学习的效能。