天天看点

深度学习工作站环境搭建及开源框架选择

工欲善其事必先利其器,硬件组装完毕,安装好操作系统后,接起来就是深度学习软件环境搭建部份了。其中就涉及到显卡驱动和CUDA、CUDNN的安装,这三块是基础,建议直接登陆Nvidia官网跟着官方文档一步步安装。

一、显卡驱动安装

活进入系统桌面后,会发现默认的分辨率只有1024x768,因为系统默认使用了开源显卡驱动,需要手动更新成N卡最新驱动。

第一步:打开设置,进入软件更新设置(Software&Updates)。

第二步:选择附加驱动,等待刷新。

第三步:选择所列出来的可以析的选项,选择应用改变即可

第四步:在终端中输入nvvidia-smi,可以查询显卡驱动状态。

深度学习工作站环境搭建及开源框架选择
深度学习工作站环境搭建及开源框架选择

二、CUDA与CUDNN安装

登陆官网下载CUDA安装包,在下载时找相应的官方安装文档仔细阅读,尽可能按照它的步骤一步步走。同时再找几篇好的博客文章作为参考,对常见的问题要知道如何解决,做到胸有成竹。

第一步:检查自己的电脑环境是否具备安装CUDA的条件。

第二步:验证自己的Linux版本是否支持CUDA。

第三步:验证系统是否安装了GCC。

第四步:通过package manager安装。

第五步:重启电脑,检查是否安装成功。

第六步:尝试编译CUDA提供的samples。

第七步:根据官网教程安装CUDNN。

三、Docker安装

深度学习涉及到各个领域的研究,相关的框架不断更新和迭代。如果在同一部主机上安装全部的框架,有可能会出现管理问题及各种包冲突问题,也不利于工作站资源的充分利用。而Docker是一个开源的应用容器引擎,可以方便地打包应用以及依赖包到一个轻量级、可移植的容器中。使用Docker,可以按自己研究的需要,配置不同的Docker镜像。Docker的安装相对简单,这里就不展开详细说明,网上也有许多现成的文章可供参考,建议大家登陆官网查找相应的安装文档即可成功安装。

四、深度学习镜像选择

在实际的研究和开发中,可以根据需求下载不同的镜像。下面列出常用的镜像名称和用途

深度学习工作站环境搭建及开源框架选择

五、成果演示

最后,让我们来看看经过以上各个环节后,如何为深度学习研究提供简单易用的开发环境:

打开终端,连到服务器,运行以下命令启动容器(根据实际情况,参数不同):

打开浏览器,访问以下地址,能够正常显示,一切正常。

深度学习工作站环境搭建及开源框架选择

继续阅读