天天看點

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

開始前先吹一波 @奶奶家的橘貓 。

大佬!我這條狗命真是你救的!

大佬的這個文章

簡潔ubuntu+win10雙系統深度學習環境搭建(裝系統,代理,顯示卡驅動,conda)

真的是太強了!

我幾乎是一路按着大佬的流程走的,除了最後代理方面我不需要代理有一點點不一樣之外。

真的是太感謝了!

下面正文

1.顯示卡安裝

我裝的也是ubuntu18.04+win10雙系統,顯示卡是裝完系統過兩天後才拿到的

獨立顯示卡:GEFORCE RTX 2070,華碩,N卡

(這顯示卡花了我的血本,千萬要順利工作啊……)

我是打算在ubuntu上跑的深度學習的,但是我好不容易裝上獨顯後,鬼使神差地先打開了win10,并且在裡面裝好了顯示卡驅動。

朋友們,裝驅動前的win10分辨率是很小的(因為核顯沒用了),裝了驅動才恢複正常的分辨率。

随後我打開ubuntu,發現分辨率是正常的,于是我開始了瘋狂推理:這兩個系統要不要裝兩個驅動?驅動應該是裝在系統裡的軟體吧?那我在win10裡裝了顯示卡驅動,怎麼回到ubuntu裡分辨率是正常的?難道n卡驅動這麼牛逼,一次性把兩個系統都裝了?可是我下載下傳的時候是下的win版本的,也沒告訴官網下載下傳選項我是雙系統啊?

這些問題燒得我腦子都大了。

為了保險起見,我特地重新開機打開了win10,又把熱乎乎剛裝好的N卡驅動給卸掉了!

跑回ubuntu一看,嚯,分辨率還是正常的!感情ubuntu這玩意兒不裝N卡驅動也有正常的分辨率啊!

得了,卸都卸了,先把ubuntu上的顯示卡驅動裝好吧。

麻溜地打開Nvidia官網,選中了我需要的顯示卡驅動版本,點選下載下傳。

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

鄰居家的網絡非常給力,140+M的驅動分分鐘就下好了。

此時ubuntu小白遇到了人生中第一個難題:這個字尾名為run的安裝檔案是個什麼玩意兒?

難道也是輕按兩下運作嗎?卡卡兩聲,一個notepad被打開了,無數行代碼開始滾動加載。

我的媽呀,吓得我狂點關閉按鈕——這個打開程式不對啊,怎麼找也不能是用記事本打開的啊!

乖乖地去網上查查run怎麼打開。大概就和win裡去找exe檔案怎麼使用一樣吧——作為常識真的很難找到該怎麼打開。

皇天不負有心人,最終還是從其他問題的蛛絲馬迹中找到了答案:

在ubuntu裡頭,隻有終端的指令行才是使用者的雙手,滑鼠什麼的都是廢物。

打開終端,先用cd指令定位到安裝包的檔案夾。

chmod +x NVIDIA-Linux-x86_64-440.82.run

這條指令是讓終端明白這個檔案是個可執行檔案。

sudo ./NVIDIA-Linux-x86_64-440.82.run

這條指令是讓終端運作這個檔案。

然後就出現了個大佬的教程中一樣的圖,我多截了幾張放在這裡。

插一句,大佬教程裡講了要先裝gcc和make,我沒聽勸,最後發現沒這個确實安裝進行不下去,就重新安裝了gcc和make,再讓終端運作顯示卡驅動才裝上。

(就是一直同意,我比大佬晚一點,版本稍微有點差別,他提醒我的cc有一點版本不一樣,可能會有不相容的情況發生,不過這也管不了了,能裝就接着裝吧。)

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

下面這裡問我lib不相容,要不要重新下載下傳一個覆寫,要得要得。

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

這裡問要不要自動更新什麼x什麼的,大佬說不我也不。

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

然後就好了,試一下看看有咩有安裝好顯示卡驅動

nvidia-smi

可以看到右上角連CUDA都有了哈哈哈。

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
2.安裝anaconda

首先也是去官網下載下傳一下安裝包

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

Linux可真有意思,安裝包都有這麼多字尾名,第一天就遇到倆。

這個安裝包的字尾名是sh,我不信邪,又輕按兩下了一下,卡卡,這個500M的文檔從記事本打開差點沒把我卡死。

老老實實搜了一下,和run檔案一樣,都是用指令行先告訴終端這是個可執行檔案,然後再安裝。

chmod +x Anaconda3-2020.02-Linux-x86_64.sh

sudo ./Anaconda3-2020.02-Linux-x86_64.sh

這個比較簡單,就是一直同意就安裝好了。

可以看到安裝好後指令行前面有(base)說明是在conda的base環境中了。

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

剛安裝完沒有base或是之後開機想進conda可以用這個指令進

source ~/anaconda3/bin/activate

這裡說一下代理的事情,大佬的教程裡講了弄代理,我一開始也跟着弄,然後發現之後安裝其他的包安裝不了,才意識到我并不明白什麼是代理。(汗顔)

大佬弄代理是因為他是公司什麼的網,需要代理才能上外網,而我本來就可以聯網,并不需要代理!

是以我就想把copy大佬的代理設定給去掉。

當時我的代理是這樣的

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

這玩意兒對我沒有用,那怎麼删掉呢?

我又網上找了一圈,沒有!全是怎麼設定代理的!沒有删除的!

氣得我咬牙切齒,

怒火中燒時

想到我雖然不知道怎麼從終端删掉代理

但是我知道這個檔案放在哪

于是一不做二不休。

gedit /home/bluecai/.condarc

打開設定檔案,直接删掉了代理的這幾句,儲存

再從終端看看

conda config --show-sources
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

美滋滋!

另外提一下,小夥伴們可以先把清華鏡像源或者國内其他鏡像源連結放進路徑裡,不然實在是太慢了,而且有時候還有問題。

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --set show_channel_urls yes

3.安裝TensorFlow

在conda裡建立環境

conda create --name myenv python=3.7

myenv是環境名,可以自己起。3.7是python的版本,可以看自己的需求弄。

activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

建立好了後進入建立的新環境

conda activate myenv

然後在我的環境裡安裝TensorFlow

conda install tensorflow-gpu
activate tensorflow_ubuntu下安裝深度學習環境Nvidia驅動+conda+TensorFlow

這裡的solving environment轉了超級久,我等了好一會,覺得太無聊了開始寫這篇教程,寫了一半,他才轉完,告訴我哪些包要裝。

裝完就安裝好TensorFlow啦!

再次感謝大佬的幫助!