天天看点

Ubuntu 18.04NVIDIA GPU在服务器重启后nvidia-smi命令失效问题

1. 问题

Linux Ubuntu 18.04,断电重启后nvidia-smi命令不可执行,具体显示什么无法建立和驱动器的通信之类的

2. 可能原因

重启过程导致内核更新,所以也有更新NVIDIA相关驱动

3. 解决方法

3.1 卸载原有驱动

Ubuntu命令:nvidia-uninstall

卸载过程中,有些没有卸载干净,会问你是否保留,选择continue(不保留)

3.2 确保禁用了nouveau

我这里已经禁用了,过程参考一下链接:具体流程

3.3 官网下载相应驱动

CUDA-Ubuntu

根据需要选择相应的驱动

下载和安装

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run
           

3.4 安装过程

一路accept和continue即可

问你是否覆盖的话,选择覆盖掉旧的

3.5 等待安装完成即可

继续阅读