文章目錄
- 前言
- 一、準備安裝包
- 二、安裝cuda
-
- 1、選擇一個臨時解壓目錄
- 2、我選了精簡,因為我看到(推薦)
- 3、這個說沒有合适版本的Visual Studio Integration,沒有關系,勾一下,Next
- 4、設定環境變量
- 5、驗證是否裝好
- 二、安裝cudnn
-
- 1、cudnn/bin下的dll,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
- 2、cudnn/include下的cudnn.h,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include
- 3、cudnn/lib/x64下的lib,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64
- 三、安裝tensorflow
-
- 1、建立個環境
- 2、開始安裝tensorflow-gpu1.14
- 3、驗證是否可用
- 4、後話
- 巨坑
- 補充
前言
為了忘卻的紀念~~~就這麼個簡單的事情,我整了超過10個小時!!不寫點什麼對不起這10個小時啊。 先給個最終可行的步驟,再說說我踩了什麼坑!
一、準備安裝包
因為我是确定要安裝tensorflow1.14版本、python用3.6的,是以我提前查了一下這個版本可以比對的cuda和cudnn版本。怎麼查?問度娘。反正我是查到cuda10.0+cudnn7.6.5是絕配!于是下載下傳了cuda_10.0.130_411.31_win10.exe和cudnn-10.0-windows10-x64-v7.6.5.32.zip。
這裡用紅色字型表示坑,開始我用了cuda10.1,結果各種問題,貌似也沒有哪裡告訴我10.1和10.0有那麼大差别!!後面重裝了10.0就好了。
cuda下載下傳位址:https://developer.nvidia.com/zh-cn
cudnn下載下傳位址:https://developer.nvidia.com/
下載下傳cudnn需要注冊 Nvidia 賬号登入進入才行。
我已經将這2個包上傳到csdn,如果你們的環境與我一緻,歡迎下載下傳,給我換點币币……(er……包太大傳不了,隻好放在百度雲盤,提供位址和取件碼)
傳送門:https://download.csdn.net/download/qq_40549606/16634766
二、安裝cuda
其實很好裝啦,輕按兩下下載下傳那個cuda_10.0.130_411.31_win10.exe:
1、選擇一個臨時解壓目錄

注意:這隻是臨時用的,不是你最終安裝的目錄哦。
2、我選了精簡,因為我看到(推薦)
3、這個說沒有合适版本的Visual Studio Integration,沒有關系,勾一下,Next
4、設定環境變量
cuda裝好以後,自動會增加2個環境變量CUDA_PATH和CUDA_PATH_V10_0:
我們需要手動在Path裡加上這4條:
5、驗證是否裝好
管理者身份打開指令行,進入cuda安裝目錄:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\extras\demo_suite(如果安裝的時候改了安裝路徑,需要修改該路徑)
運作 bandwidthTest.exe 和 deviceQuery.exe ,如果最後都顯示 Result = PASS 則說明安裝成功。
二、安裝cudnn
這個更簡單,解壓,然後把檔案放到cuda安裝目錄下對應的目錄即可:
1、cudnn/bin下的dll,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
2、cudnn/include下的cudnn.h,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include
3、cudnn/lib/x64下的lib,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64
搞掂~~~
三、安裝tensorflow
1、建立個環境
我用ANACONDA來管理環境,是以到指令行執行:
conda create -n tfgpu114 pip python=3.6
tfgpu114 是我的環境名,你可以随意取名。
切換到該環境:
conda activate tfgpu114
2、開始安裝tensorflow-gpu1.14
pip install tensorflow-gpu==1.14
3、驗證是否可用
import tensorflow as tf
version = tf.__version__
gpu_ok = tf.test.is_gpu_available()
print("tf version:", version, "\n use GPU:", gpu_ok)
gpu_ok2 = tf.test.is_built_with_cuda()
print("is_built_with_cuda:", gpu_ok2)
這樣就對了!
4、後話
因為我要用到keras,我用conda install keras,發現要安裝tensorflow2.1版本,如果下載下傳了更進階的tensorflow版本,那麼我之前裝的1.14就不起效了,是以我終止了這個安裝。
查了一下keras和tensorflow的關系:
于是我安裝keras2.2.5:
conda install keras==2.2.5
至此,安裝部分結束。
下面講一下那個巨坑。
巨坑
我的電腦原來裝好了cuda10.1版本,我就在此基礎上安裝cudnn7.6.5,tensorflow1.14,裝好以後一運作驗證程式,報錯說缺少cudart64_100.dll檔案。我上網一搜,這很好解決,另外下載下傳這個檔案放到cuda安裝目錄下的bin就可以了。
我這麼幹了,當時确實不再報錯,但是正是這個原因,一直無法用GPU。這個問題很隐蔽,一步步都很能驗證通過,就是到最後驗證程式那裡,一直是False。各種折騰以後,我才決定全部重來。這一次,不知道為啥,我選擇了cuda10.0,正是這個英明的決定,我成功了!
補充
要監控GPU使用率,很多人說cd C:\Program Files\NVIDIA Corporation\NVSMI目錄,執行nvidia-smi,可是我找了找,我并沒有這個目錄啊。後面發現原來windows10,直接執行即可: