本文參考了其他内容。
- 安裝nvidia驅動
注意,安裝cuda自帶的驅動,經常裝不上。是以強烈建議單獨安裝驅動。
具體步驟參考:《
Ubuntu16.04+NVIDIA顯示卡驅動安裝步驟》
當然,軟體版本可以用最新的。
- 安裝cuda
提示安裝驅動時,選擇no。
其他yes、預設即可。
- 安裝docker
# step 1: 安裝必要的一些系統工具
sudo apt-get update
sudo apt-get -y install apt-transport-https ca-certificates curl software-properties-common
# step 2: 安裝GPG證書
curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -
# Step 3: 寫入軟體源資訊
sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"
# Step 4: 更新并安裝 Docker-CE
sudo apt-get -y update
sudo apt-get -y install docker-ce
- 安裝nvidia-docker2
# 清理以前的。If you have nvidia-docker 1.0 installed: we need to remove it and all existing GPU containers
sudo docker volume ls -q -f driver=nvidia-docker | xargs -r -I{} -n1 docker ps -q -a -f volume={} | xargs -r docker rm -f
sudo apt-get purge -y nvidia-docker
sudo apt autoremove
# 執行指令。Add the package repositories
# command 1
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | \
sudo apt-key add -
# command 2
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
# command 3
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | \
sudo tee /etc/apt/sources.list.d/nvidia-docker.list
sudo apt-get update
# 正式安裝。Install nvidia-docker2 and reload the Docker daemon configuration
sudo apt-get install -y nvidia-docker2
sudo pkill -SIGHUP dockerd
# 測試一下。 Test nvidia-smi with the latest official CUDA image
sudo docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi
- 出錯的解決辦法
《
解決辦法:nvidia-docker2 : 依賴: docker-ce (= 5:18.09.0~3-0~ubuntu-xenial)