1.按Ctrl+alt+f1進入字元界面指令行
檢查gcc:gcc --version
檢查cuda:nvcc -V
顯示本機gpu資訊:lspci | grep -i nvidia
2.關閉圖形界面,
sudo service lightdm stop
lsmod | grep nouveau 如果沒有輸出則正确,否則需要手動禁掉nouveau(方法可以參考前面的安裝nvidia驅動)
3.解除安裝驅動
sudo apt-get remove --purge nvidia-*
sudo apt-get autoremove
sudo sh NVIDIAxxx.run --uninstall
4.重新安裝驅動
run檔案的安裝需要先安裝gcc-multilib:sudo apt install gcc-multilib
sudo sh ./NVIDIA-Linux-x86_64-390.87.run --no-x-check --no-nouveau-check --no-opengl-files
安裝選項為:accept;對于系統中已經存在一個驅動選擇Continue installation;對于the distribution-provided pre-install script failed!選擇Continue;對于安裝32位選擇NO;對于使用nvidia-xconfig utility to automatically update your X Configuration files等選擇NO;對于是否使用DKMS來注冊kernel module選擇No;
如果出現:不能加載nvidia-drm子產品問題和後面的ERROR:安裝失敗等資訊的話,再重新開機一下再來一遍解除安裝重裝基本就可以了。
apt 安裝:
(1)添加Graphic Drivers PPA:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
(2)尋找合适的驅動版本:
ubuntu-drivers devices
(3)安裝驅動
sudo apt install nvidia-390
5.nvidia-smi檢查有沒有輸出從新打開圖形界面,sudo service lightdm start
6.出現登入界面輸入密碼就可以登入進去了.重新開機可以解決卡頓的問題。
但是出現另外一個問題,就是cuda用不了了,運作程式,檢測出來
RuntimeError: cuda runtime error (38) : no CUDA-capable device is detected at /opt/conda/conda-bld/pytorch_1549628766161/work/aten/src/THC/THCGeneral.cpp:51
那麼
1.解除安裝原來的cuda,
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
sudo rm -rf /usr/local/cuda-9.0
2.安裝cuda,
sudo sh cuda_9.0.176_384.81_linux.run
安裝過程說明:accept;不安裝驅動no;安裝toolkit 選擇yes;全是預設路徑;同意建立軟連接配接;安裝測試選擇yes
sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
sudo sh cuda_9.0.176.3_linux.run
sudo sh cuda_9.0.176.4_linux.run
接下來的步驟和之前的那篇安裝cuda的一樣