基本配置:Windows10家庭版+Anaconda虛拟環境Python3.6.8+Tensorflow-gpu-1.14.0+CUDA 10.0+cuDNN 7.4.2(1.13.0版本開始支援python3.7和CUDA 10、TensorRT 5.0)

說明:官方安裝教程顯示也是支援其他版本的:
tensorflow中文官網教程就是以VS2015參照的,而且還給出了經過測試的各版本組合(目前暫未給出win10+cuda10,本人想嘗試安裝比較新的版本)。
首先下載下傳Visual C++ 生成工具 2015。此軟體包随附在 Visual Studio 2015 中,但可以單獨安裝。進入Visual Studio 下載下傳頁面,選擇“可再發行元件和生成工具”,下載下傳并安裝:
Microsoft Visual C++ 2015 Redistributable 更新 3,Microsoft 生成工具 2015 更新 3。
首先打開NVIDIA控制台檢視自己的顯示卡和驅動支援多少版本的CUDA,為了安裝最新版本的CUDA我把顯示卡驅動更新到最新了,更新前可以找個軟體備份下原驅動。
進入官網下載下傳界面下載下傳相應版本cuda。
下載下傳後的安裝步驟參考官方教程。
安裝完成後簡單檢查一下cuda的版本:nvcc -V(更為完善的檢查文末會提到)。
再看一下環境變量是否配置成功,這個應該是在安裝過程中自動添加了。右鍵“此電腦”-“屬性”-“進階系統設定”-“進階”-“環境變量”。
進入官網下載下傳界面下載下傳對應cuda10.0的cudnn7.4.2(這裡選擇v7.4.2版本是考慮到下一個釋出的7.5.0版本開始支援cuda10.1了,為規避安裝失敗的風險)。
下載下傳後的安裝步驟參考官方教程。
解壓cudnn7.4.2得到cuda檔案夾,然後複制下面三個檔案到 CUDA Toolkit 目錄(CUDA我是預設目錄安裝的) 。
複制<cuDNN路徑下>cudabincudnn64_7.dll 到 C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.0bin.
複制 <cuDNN路徑下>cuda includecudnn.h 到 C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.0include.
複制 <cuDNN路徑下>cudalibx64cudnn.lib 到 C:Program FilesNVIDIA GPU Computing ToolkitCUDAv10.0libx64.
按照官方說明還需對 cudnn.lib 進行連結,我沒連結也能正常使用了(其實我不會哈哈)。
四、安裝tensorflow-gpu并測試pip install tensorflow-gpu
簡單測試tensorflow-gpu
import
其實一開始下載下傳的是CUDA最新版cuda_10.1.168_425.25_win10.exe,然後搭配的對應于cuda10.1的cuDNN最新版cudnn7.6.2,兩者都已成功安裝并通過比“nvcc -V”更進一步的測試:用VS2015打開C:ProgramDataNVIDIA CorporationCUDA Samplesv10.1(預設的安裝目錄)下的Samples_vs2015.sln檔案,找到1_Utilities檔案右鍵點選生成,生成完畢後去C:ProgramDataNVIDIA CorporationCUDA Samplesv10.1binwin64Release檔案下cmd分别運作deviceQuery(測試能否找到顯示卡并且驅動是否正确)和bandwidthTest(測試CUDA版本及其它必要的測試),如下圖:
但是後面 import tensorflow 的時候出現了如下錯誤:
這個報錯的意思應該是目前的tensorflow-1.14.0版本不支援CUDA-10.1,它提供了官方網址讓去下載下傳CUDA-10.0,另外尚未了解tensorflow-2.0新版本是否支援最新的CUDA-10.1。
PS:來回折騰了兩天多可算給windows10配置了比較新版的環境,下一步打算在Ubuntu18.04上也嘗試下新版本(據說直接 conda install tensorflow-gpu 一句搞定,不知道是不是配置的最新版本),後續如果踩坑比較多的話再追加。