天天看點

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

文章目錄

  • 前言
  • 一、準備安裝包
  • 二、安裝cuda
    • 1、選擇一個臨時解壓目錄
    • 2、我選了精簡,因為我看到(推薦)
    • 3、這個說沒有合适版本的Visual Studio Integration,沒有關系,勾一下,Next
    • 4、設定環境變量
    • 5、驗證是否裝好
  • 二、安裝cudnn
    • 1、cudnn/bin下的dll,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
    • 2、cudnn/include下的cudnn.h,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include
    • 3、cudnn/lib/x64下的lib,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64
  • 三、安裝tensorflow
    • 1、建立個環境
    • 2、開始安裝tensorflow-gpu1.14
    • 3、驗證是否可用
    • 4、後話
  • 巨坑
  • 補充

前言

為了忘卻的紀念~~~就這麼個簡單的事情,我整了超過10個小時!!不寫點什麼對不起這10個小時啊。 先給個最終可行的步驟,再說說我踩了什麼坑!

一、準備安裝包

因為我是确定要安裝tensorflow1.14版本、python用3.6的,是以我提前查了一下這個版本可以比對的cuda和cudnn版本。怎麼查?問度娘。反正我是查到cuda10.0+cudnn7.6.5是絕配!于是下載下傳了cuda_10.0.130_411.31_win10.exe和cudnn-10.0-windows10-x64-v7.6.5.32.zip。

這裡用紅色字型表示坑,開始我用了cuda10.1,結果各種問題,貌似也沒有哪裡告訴我10.1和10.0有那麼大差别!!後面重裝了10.0就好了。

cuda下載下傳位址:https://developer.nvidia.com/zh-cn

cudnn下載下傳位址:https://developer.nvidia.com/

下載下傳cudnn需要注冊 Nvidia 賬号登入進入才行。

我已經将這2個包上傳到csdn,如果你們的環境與我一緻,歡迎下載下傳,給我換點币币……(er……包太大傳不了,隻好放在百度雲盤,提供位址和取件碼)

傳送門:https://download.csdn.net/download/qq_40549606/16634766

二、安裝cuda

其實很好裝啦,輕按兩下下載下傳那個cuda_10.0.130_411.31_win10.exe:

1、選擇一個臨時解壓目錄

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充
window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

注意:這隻是臨時用的,不是你最終安裝的目錄哦。

2、我選了精簡,因為我看到(推薦)

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

3、這個說沒有合适版本的Visual Studio Integration,沒有關系,勾一下,Next

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

4、設定環境變量

cuda裝好以後,自動會增加2個環境變量CUDA_PATH和CUDA_PATH_V10_0:

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

我們需要手動在Path裡加上這4條:

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

5、驗證是否裝好

管理者身份打開指令行,進入cuda安裝目錄:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\extras\demo_suite(如果安裝的時候改了安裝路徑,需要修改該路徑)

運作 bandwidthTest.exe 和 deviceQuery.exe ,如果最後都顯示 Result = PASS 則說明安裝成功。

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充
window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

二、安裝cudnn

這個更簡單,解壓,然後把檔案放到cuda安裝目錄下對應的目錄即可:

1、cudnn/bin下的dll,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

2、cudnn/include下的cudnn.h,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

3、cudnn/lib/x64下的lib,放到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

搞掂~~~

三、安裝tensorflow

1、建立個環境

我用ANACONDA來管理環境,是以到指令行執行:

conda create -n tfgpu114 pip python=3.6
           

tfgpu114 是我的環境名,你可以随意取名。

切換到該環境:

conda activate tfgpu114
           

2、開始安裝tensorflow-gpu1.14

pip install tensorflow-gpu==1.14
           

3、驗證是否可用

import tensorflow as tf

version = tf.__version__
gpu_ok = tf.test.is_gpu_available()
print("tf version:", version, "\n use GPU:", gpu_ok)
gpu_ok2 = tf.test.is_built_with_cuda()

print("is_built_with_cuda:", gpu_ok2)
           
window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

這樣就對了!

4、後話

因為我要用到keras,我用conda install keras,發現要安裝tensorflow2.1版本,如果下載下傳了更進階的tensorflow版本,那麼我之前裝的1.14就不起效了,是以我終止了這個安裝。

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

查了一下keras和tensorflow的關系:

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

于是我安裝keras2.2.5:

conda install keras==2.2.5
           

至此,安裝部分結束。

下面講一下那個巨坑。

巨坑

我的電腦原來裝好了cuda10.1版本,我就在此基礎上安裝cudnn7.6.5,tensorflow1.14,裝好以後一運作驗證程式,報錯說缺少cudart64_100.dll檔案。我上網一搜,這很好解決,另外下載下傳這個檔案放到cuda安裝目錄下的bin就可以了。

我這麼幹了,當時确實不再報錯,但是正是這個原因,一直無法用GPU。這個問題很隐蔽,一步步都很能驗證通過,就是到最後驗證程式那裡,一直是False。各種折騰以後,我才決定全部重來。這一次,不知道為啥,我選擇了cuda10.0,正是這個英明的決定,我成功了!

補充

要監控GPU使用率,很多人說cd C:\Program Files\NVIDIA Corporation\NVSMI目錄,執行nvidia-smi,可是我找了找,我并沒有這個目錄啊。後面發現原來windows10,直接執行即可:

window10下安裝tensorflow-gpu1.14(RTX2080Ti+cuda10.0+cudnn7.6.5)前言一、準備安裝包二、安裝cuda二、安裝cudnn三、安裝tensorflow巨坑補充

繼續閱讀