目錄
先決條件
1. Nvidia驅動安裝/更新
2. Docker安裝及更新
安裝nvidia-docker
1. 安裝
2. 測試
先決條件
安裝nviida-docker,需要:
1. nvidia驅動【nvidia-smi】。驅動版本:430+,CUDA版本:10.+。
2. docker【docker info】,版本:19+。
檢視結果見下圖:

1. Nvidia驅動安裝/更新
(1)更新驅動
# 安裝/更新驅動
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
yum install kmod-nvidia
# 重新開機
reboot
(2)重新開機檢測
ls -la /dev | grep nvidia
nvidia-smi
2. Docker安裝及更新
(1)删除舊版本docker
# 檢視本機docker
rpm -qa | grep docker # 檢視為18.09,低于1.19
# 删除本機docker
rpm -qa | grep docker|xargs -i yum remove {}
(2)更新最新版本
curl -fsSL https://get.docker.com/ | sh
(3)重新開機docker,檢查結果
systemctl restart docker
docker info
安裝nvidia-docker
GIthub位址:https://github.com/NVIDIA/nvidia-docker/
找到CentOS的安裝方法
1. 安裝
# 準備
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo
# 安裝
yum install -y nvidia-container-toolkit
# 重新開機
systemctl restart docker
2. 測試
# 啟動所有GPU支援的GPU docker
docker run --gpus all nvidia/cuda:9.0-base nvidia-smi
# 指定GPU個數,并啟動GPU docker.
docker run --gpus 1 nvidia/cuda:9.0-base nvidia-smi
# 指定GPU id,并啟動GPU docker.
docker run --gpus '"device=1"' nvidia/cuda:9.0-base nvidia-smi
測試結果如下: