目录
先决条件
1. Nvidia驱动安装/升级
2. Docker安装及升级
安装nvidia-docker
1. 安装
2. 测试
先决条件
安装nviida-docker,需要:
1. nvidia驱动【nvidia-smi】。驱动版本:430+,CUDA版本:10.+。
2. docker【docker info】,版本:19+。
查看结果见下图:

1. Nvidia驱动安装/升级
(1)更新驱动
# 安装/更新驱动
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
yum install kmod-nvidia
# 重启
reboot
(2)重启检测
ls -la /dev | grep nvidia
nvidia-smi
2. Docker安装及升级
(1)删除旧版本docker
# 查看本机docker
rpm -qa | grep docker # 查看为18.09,低于1.19
# 删除本机docker
rpm -qa | grep docker|xargs -i yum remove {}
(2)升级最新版本
curl -fsSL https://get.docker.com/ | sh
(3)重启docker,检查结果
systemctl restart docker
docker info
安装nvidia-docker
GIthub地址:https://github.com/NVIDIA/nvidia-docker/
找到CentOS的安装方法
1. 安装
# 准备
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo
# 安装
yum install -y nvidia-container-toolkit
# 重启
systemctl restart docker
2. 测试
# 启动所有GPU支持的GPU docker
docker run --gpus all nvidia/cuda:9.0-base nvidia-smi
# 指定GPU个数,并启动GPU docker.
docker run --gpus 1 nvidia/cuda:9.0-base nvidia-smi
# 指定GPU id,并启动GPU docker.
docker run --gpus '"device=1"' nvidia/cuda:9.0-base nvidia-smi
测试结果如下: