
本系列将利用docker和阿里云容器服务,帮助您上手tensorflow的机器学习方案
第一篇 打造tensorflow的实验环境 - 本文
机器学习作为人工智能重要的技术,已经在计算机视觉、自然语言处理、医学诊断等等领域得到了广泛的应用。tensorflow 是谷歌推出的开源的分布式机器学习框架,它也是github社区上最受关注的机器学习项目,目前点赞已经超过3万个星。
本文是系列中的第一篇文章,会基于docker快速创建一个tensorflow学习环境。
为了利用docker和docker compose编排搭建实验环境,我们需要
首先执行如下命令获得教程代码 (包含对tensorflow 1.0 的支持)
为了运行这个教程你需要安装tensorflow的执行环境,并配置"jupyter", "tensorboard"来进行交互操作。
一个最简单的方法是在当前目录,创建如下的<code>docker-compose.yml</code>模板
执行如下命令一键创建tensorflow的学习环境
我们可以检查启动的docker容器
登录密码为: tensorflow
注:
其中<code>registry.cn-hangzhou.aliyuncs.com/denverdino/tensorflow:1.0.0</code>是基于<code>tensorflow/tensorflow:1.0.0</code>镜像构建的,只添加了apt源和pipy源的阿里云镜像。 大家也可以参照<code>https://github.com/denverdino/tensorflow-docker</code>中的dockerfile自己构建,预先添加自己所需的python库、算法库等资源。
利用volumes机制,jupyter可以直接从当前notebooks目录获取示例。jupyter和tensorboard两个容器也通过可以文件卷来共享事件日志。
阿里云容器服务支持docker compose模板部署,通过下面模板我们可以轻松把tensorflow的学习环境部署到云端
利用<code>aliyun.routing</code>标签,我们可以轻松定义jupyter和tensorboard的访问访问端点
如果是老集群,需要点击容器服务agent升级来提供所需特性和稳定性增强。
几分钟之后,我们就可以在云端有一个学习环境来体验tensorflow。
我们可以利用docker和阿里云容器服务轻松在本地和云端搭建tensorflow的学习环境。docker作为一个标准化的软件交付手段,可以大大简化应用软件的部署和运维复杂度。阿里云容器服务支持以docker compose的方式进行容器编排,并提供了众多扩展,可以方便地支持基于容器的微服务应用的云端部署和管理。
阿里云容器服务还会和高性能计算(hpc)团队一起配合,之后在阿里云上提供结合gpu加速和docker集群管理的机器学习解决方案,在云端提升机器学习的效能。