手把手教你安裝深度學習軟體環境（附代碼）

為了進行強化學習研究，我最近購置了一台基于 Ubuntu 和英偉達 GPU 的深度學習機器。盡管目前在網絡中能找到一些環境部署指南，但目前仍然沒有全面的安裝說明。另外，我也不得不閱讀了很多文檔來試圖了解安裝細節——其中的一些并不完整，甚至包含文法錯誤。是以，本文試圖解決這個問題，提供一個詳盡的軟體環境安裝指南。

本文将指導你安裝

作業系統（Ubuntu）

4 種驅動和庫（GPU 驅動、CUDA、cuDNN 和 pip）

5 種 Python 深度學習庫（TensorFlow、Theano、CNTK、Keras 和 PyTorch）

這些軟體之間的互相依賴關系如下圖所示。其中，你隻需要安裝一種深度學習庫，請自由選擇。

深度學習軟體安裝和依賴示意圖

以下是各個軟體的細節介紹：

Ubuntu（v16.04.3）——作業系統，各種任務處理。

Nvidia GPU 驅動（v375）——允許系統獲得 GPU 帶來的加速。

CUDA（v8.0）——GPU C 語言庫。「計算同一裝置架構」。

cuDNN（v6.0.21）——基于 CUDA 的深度學習基元庫。「CUDA 深度學習庫」。

pip（v9.0.1）——Python 安裝包。「Pip 安裝包」。

TensorFlow（v1.3）——谷歌開發的深度學習架構。

Theano（v0.9.0）——此前由 MILA 負責維護的深度學習架構。

CNTK（v2.2）——微軟研究院開發的深度學習架構。

Keras（v2.0.8）——深度學習包裝可互換後端。可與 TensorFlow、Theano 和 CNTK 共同使用。

PyTorch（v0.2.0）——可被 GPU 加速的動态圖深度學習架構，主要由 Facebook 的研究人員負責開發。

1. 安裝 Ubuntu 16.04.3

v 16.04.3 可由 USB 啟動的方式安裝，它是最新的 LTS（長期支援）版本。首次在電腦上啟用時，請在 BIOS 中選擇由 USB 引導啟動。

我的電腦中有兩塊硬碟——一塊 1TB 的 SATA 和一塊 256GB 的 SSD。在我的設想中，Ubuntu 被安裝在正常硬碟中，固态硬碟（SSD）用于處理資料集和加速訓練。在安裝過程中，在螢幕中的 Installation Type 中選擇 Something else，随後我們要進行三個分區操作：

引導分區（128GB）：包含系統檔案、程式設定和文檔。

交換分區（2 倍的記憶體大小）：對于我來說這就是 128GB。這塊分區的容量用于擴充 Kernel RAM 作為虛拟記憶體使用。

使用者分區（剩下的部分）：1TB 的硬碟剩下的空間大約還有 744GB。

在安裝後，最好先運作以下指令來更新核心版本。

sudo apt-get update

sudo apt-get upgrade

Reference：https://tutorials.ubuntu.com/tutorial/tutorial-install-ubuntu-desktop#0

2. 安裝英偉達 GPU 驅動

在安裝完 Ubuntu 後，你可能會發現螢幕的分辨率不對，而且不能修改，這是因為現在還沒有安裝 GPU 驅動。

安裝驅動有兩種方法：從 Ubuntu 資源庫和資料源。第一個方法更加容易，但需要頻繁的重新安裝。使用 sudo apt-get update 和 sudo apt-get upgrade 指令後，系統的核心可以自動更新。但這樣并不會更新英偉達驅動，可能會導緻 GUI 無法正确加載。從資料源安裝可以避免這個問題。

從安裝包裡安裝 v375 驅動（簡單的方法）

以下指令會将與你系統相相容的驅動版本顯示出來，它會提供兩個版本号：最新的不穩定版和長期穩定版。版本号會從頭列起，是以你需要把頁面滾到最上面。

sudo add-apt-repository ppa:graphics-drivers/ppa

添加并安裝資源庫。通過第二個指令，改變你想要安裝的<driver_number>。我們在這裡推薦安裝最新的長期穩定版本——375 版。

sudo apt-get install nvidia-<driver_number>

重新開機計算機以重新配置視訊輸出。

sudo shutdown -r now

要測試驅動程式是否工作，Screen Display（SUPERKEY，螢幕顯示類型）現在應該可以識别你使用的顯示器了，你可以修改設定、分辨率與方向。

Reference：https://launchpad.net/~graphics-drivers/+archive/ubuntu/ppa

從英偉達網站安裝 v384.90（較難的方法）

從英偉達網站下載下傳最新的驅動程式版本。基于硬體配置，我選擇的選項是：

GeForce -> GeForce 10 Series -> GeForce GTX 1080 -> Linux 64 bit -> English (UK)

可選條件：編譯到 32 位架構和 GUI 的開發版本。

sudo apt-get install gcc-multilib xorg-dev

按 CTRL + ALT + F1 鍵登入，從 GUI 轉至終端。為了重建視訊輸出，必須先将其暫停。

sudo service lightdm stop

如果指令行沒有效果，Ubuntu 新版本使用 systemctl 替換 lightdm。然後使 runfile 可執行，并運作它。

cd <download location>

chmod +x NVIDIA-Linux-x86_64-384.90.run

sudo ./NVIDIA-Linux-x86_64-384.90.run --dkms

運作時，你可能會收到一條 pre-install script failed 資訊。這沒什麼影響，因為預安裝腳本包含指令 exit 1，其目标是確定你真的想安裝驅動程式。

選項--dkms（預設開啟）在 kernel 自行更新時将驅動程式安裝至子產品中，進而阻止驅動程式重新安裝。在 kernel 更新期間，dkms 觸發驅動程式重編譯至新的 kernel 子產品堆棧。

如果安裝失敗，則原因在于計算機的 BIOS 未關閉 Secure Boot。重新開機電腦，在 BIOS 選項中關閉 Secure Boot。

如果安裝成功，則可以重新開機 GUI。

sudo service lightdm start

解除安裝：sudo ./NVIDIA-Linux-x86_64-384.90.run --uninstall

驗證

確定以下指令能夠識别正确的 GPU 版本

nvidia-smi

確定驅動程式版本号與你安裝的一緻

cat /proc/driver/nvidia/version

3. 安裝 CUDA 8.0

從英偉達網站，使用下列系統屬性下載下傳 CUDA 的 runfile（位址：https://developer.nvidia.com/cuda-downloads）。

Linux -> x86_64 -> Ubuntu -> 16.04 -> .deb(network)

導航至.deb 檔案的位置後，将該檔案解壓縮，更新軟體包清單，使用下列指令安裝 CUDA。

sudo dpkg -i cuda-repo-ubuntu1604-8-0-local-ga2_8.0.61-1_amd64.deb

sudo apt-get install cuda

将庫添加至 bash path，這樣就可以使用其他應用找到庫了。

echo 'export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}' >> ~/.bashrc

echo 'export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashrc

source ~/.bashrc

驗證時，使用 nvcc -V 確定 Nvidia C Compiler（nvcc）版本與 CUDA 的版本比對。

重新開機電腦 sudo shutdown -r now，完成安裝。

可選操作：測試 CUDA 安裝

測試安裝的一個方法是運作一些示例。以下指令行建立了一個存儲示例程式的 test_CUDA 目錄。

mkdir test_CUDA

cd test_CUDA

./cuda-install-samples-8.0.sh .

子目錄 NVIDIA_CUDA-8.0_Samples/3_Imaging/cudaDecodeGL 中是 findgllib.mk 檔案。該檔案的第 61 行 30 列包含了英偉達驅動程式的寫死值，該值應從 367 更改成你安裝的驅動程式版本号。

編譯示例

cd ../.. && make

你現在可以在 NVIDIA_CUDA-8.0_Samples 内随意運作示例。你可以在 NVIDIA_CUDA-8.0_Samples/bin/x86_64/linux/release 中找到兩個非常有用的腳本：./deviceQuery 可以在使用過程中列印 GPU，./bandwidthTest 可以列印它的帶寬。

Reference：http://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html

4. 安裝 cuDNN 6.0.21

在英偉達網站上注冊開發者項目，同意條款。從下拉菜單中選擇 cuDNN v6.0.21 (April 27, 2017), for CUDA 8.0，并下載下傳：

cuDNN v6.0 Runtime Library for Ubuntu16.04 (Deb)

cuDNN v6.0 Developer Library for Ubuntu16.04 (Deb)

cuDNN v6.0 Code Samples and User Guide for Ubuntu16.04 (Deb)

.deb 優先于.tar，因為.deb 格式更适用于 Ubuntu，可以進行更純淨的安裝。使用下列指令安裝這三個包：

sudo dpkg -i libcudnn6_6.0.21-1+cuda8.0_amd64.deb

sudo dpkg -i libcudnn6-dev_6.0.21-1+cuda8.0_amd64.deb

sudo dpkg -i libcudnn6-doc_6.0.21-1+cuda8.0_amd64.deb

測試 cuDNN

将已安裝的示例複制到可讀目錄，然後編譯并運作 mnistCNN。

cp -r /usr/src/cudnn_samples_v6/ $HOME

cd $HOME/cudnn_samples_v6/mnistCUDNN

make clean && make

./mnistCUDNN

如果一切順利，腳本應該會傳回一條 Test passed! 消息。

解除安裝 cudnn

使用以下指令解除安裝三個庫。另外，如果你已經建立了樣本，那麼再加上 rm -r ~/cudnn_samples_v6。

sudo apt-get remove libcudnn6

sudo apt-get remove libcudnn6-dev

sudo apt-get remove libcudnn6-doc

Reference：cuDNN Installation Guide cuDNN Installation Guide（http://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html）

5. 安裝 pip 9.0.1

Pip 的更新非常頻繁，幾乎每兩周一次，建議使用最新版本的 pip。

請使用以下指令安裝和更新最新版本的 pip。

sudo apt-get install python-pip python-dev

sudo pip install --upgrade pip

驗證：請確定鍵入 pip -V 後可以列印出版本号。

6. 安裝 Tensorflow 1.3.0

pip install tensorflow-gpu

驗證：啟動$ python，确認是否以下腳本能夠列印出 Hello, Tensorflow!

import tensorflow as tf

hello = tf.constant('Hello, TensorFlow!')

sess = tf.Session()

print(sess.run(hello))

Reference：https://www.tensorflow.org/install/install_linux

7. 安裝 Theano 0.10

Theano 需要的系統環境：

sudo apt-get install libopenblas-dev cmake git

此外還要遵循 Python 的系統需求。

sudo pip install numpy scipy nose sphinx pydot-ng pycuda scikit-cuda cython

libgpuarray 可以讓 Theano 使用 GPU，它必須從源編譯。首先下載下傳源代碼

git clone https://github.com/Theano/libgpuarray.git

cd libgpuarray

将其編譯為一個名為 Build 的檔案夾。

mkdir Build

cd Build

cmake .. -DCMAKE_BUILD_TYPE=Release

make

sudo make install

随後将其編譯成一個 Python 包。

cd ..

python setup.py build

sudo python setup.py install

将下面一行添加至 ~/.bashrc，這樣 Python 就可以找到庫了。

export LD_LIBRARY_PATH=/usr/local/lib/:$LD_LIBRARY_PATH

最後，安裝 Theano

sudo pip install git+https://github.com/Theano/Theano.git#egg=Theano

驗證：建立測試檔案 test_theano.py，其中的内容複制自：http://deeplearning.net/software/theano/tutorial/using_gpu.html#testing-theano-with-GPU

随後看看 THEANO_FLAGS=device=cuda0 python test_theano.py 在使用了 GPU 之後是否成功。

Reference: Theano 0.9.0 documentation（http://deeplearning.net/software/theano/install_ubuntu.html）

8. 安裝 CNTK 2.2

sudo pip install https://cntk.ai/PythonWheel/GPU/cntk-2.2-cp27-cp27mu-linux_x86_64.whl

驗證：輸入 python -c "import cntk; print(cntk.__version__)"，輸出 2.2。

Reference: Setup CNTK on your machine（https://docs.microsoft.com/en-us/cognitive-toolkit/setup-cntk-on-your-machine）

9. 安裝 Keras 2.0.8

sudo pip install keras

驗證：檢查$ python 中的 import keras 是否成功。

Reference: Keras Installation（https://keras.io/#installation）

10. 安裝 PyTorch 0.2.0

PyTorch 運作在兩個庫上： torchvision 和 torch，我們需要這樣安裝：

sudo pip install http://download.pytorch.org/whl/cu80/torch-

0.2.0.post3-cp27-cp27mu-manylinux1_x86_64.whl

sudo pip install torchvision

驗證：以下腳本能夠列印出一個帶有随機初始浮點數的張量。

from __future__ import print_function

import torch

x = torch.Tensor(5, 3)

print(x)

Reference: http://pytorch.org/

結論

目前為止，整個過程中最難的部分是找出 Nvidia 驅動和深度學習包之間的依賴關系，以及最有效的長期安裝過程。而最簡單的部分是安裝 Python，安裝包和文檔都得到了良好的維護。

雖然閱讀文檔和源代碼都非常耗費時間，但了解每個軟體包的建構和功能是非常具有啟發性的，它也可以幫助我們了解整個 Ubuntu 生态系統。

希望本文對你有所幫助。

原文釋出時間為：2017-10-04

本文來自雲栖社群合作夥伴“資料派THU”，了解相關資訊可以關注“資料派THU”微信公衆号

手把手教你安裝深度學習軟體環境（附代碼）

繼續閱讀

來自python的【條件控制/語句循環/break/continue/else/pass】一、條件控制二、語句循環

無法解析的外部符号 wmain，該符号在函數 "void cdecl mainCRTStartupHelper(struct HINSTANCE *,unsigned short con......

TestLink導出用例轉換工具(XML2Excel)

YAML簡介和PyYAML安全操作YAML支援的類型YAML的優點：yaml的基本文法python操作

Small tricks

libsvm for python 安裝

學習軟體測試基礎測試第七天

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入