天天看點

Ubuntu 18.04NVIDIA GPU在伺服器重新開機後nvidia-smi指令失效問題

1. 問題

Linux Ubuntu 18.04,斷電重新開機後nvidia-smi指令不可執行,具體顯示什麼無法建立和驅動器的通信之類的

2. 可能原因

重新開機過程導緻核心更新,是以也有更新NVIDIA相關驅動

3. 解決方法

3.1 解除安裝原有驅動

Ubuntu指令:nvidia-uninstall

解除安裝過程中,有些沒有解除安裝幹淨,會問你是否保留,選擇continue(不保留)

3.2 確定禁用了nouveau

我這裡已經禁用了,過程參考一下連結:具體流程

3.3 官網下載下傳相應驅動

CUDA-Ubuntu

根據需要選擇相應的驅動

下載下傳和安裝

wget http://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run
           

3.4 安裝過程

一路accept和continue即可

問你是否覆寫的話,選擇覆寫掉舊的

3.5 等待安裝完成即可

繼續閱讀