gpu機器安裝nvidia-smi和python的tensorflow-gpu子產品

2023-06-23 07:47:20

os: ubuntu14.04.4

python: 2.7.13

tensorflow-gpu: 1.4.1

cuda: 8.0.44-1

cudnn: cudnn-8.0-linux-x64-v6.0-tgz

1.安裝支援gpu設定的tensorflow-gpu

pip install tensorflow-gpu==1.4.1 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

2.安裝cuda

dpkg -i cuda-repo-ubuntu1404_10.0.130-1_amd64.deb
apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/7fa2af80.pub
apt-get update
apt-get install cuda=8.0.44-1

安裝完cuda，就有nvidia-smi指令可以在shell指令行檢視gpu裝置。因為nvidia-418、nvidia-418-dev這2個已經被當成依賴安裝完成了。

gpu機器安裝nvidia-smi和python的tensorflow-gpu子產品

當時因為碰到這個問題 https://devtalk.nvidia.com/default/topic/1048630/b/t/post/5322060/

解決思路來自 https://developer.nvidia.com/cuda-10.0-download-archive選擇作業系統、版本，下載下傳cuda-repo-ubuntu1404_10.0.130-1_amd64.deb。

3.安裝cudnn

因為libcudnn.so.6: cannot open shared object file: No such file or directory這個報錯

google了一圈發現，問題出在 TensorFlow 1.4-gpu 是基于cuDNN6，需要的也就是libcudnn.so.6了。

解決方案：

到官網https://developer.nvidia.com/cudnn下載下傳相應的cudnn庫

tar xvzf cudnn-8.0-linux-x64-v6.0.tgz

cp -P cuda/include/cudnn.h /usr/local/cuda/include

cp -P cuda/lib64/libcudnn* /usr/local/cuda/lib64

chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

Now set Path variables

$ vim ~/.bashrc

翻到最底部加上：

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"

export CUDA_HOME=/usr/local/cuda

最後進去python指令行

from tensorflow.python.client import device_lib

print(device_lib.list_local_devices())

看看輸出資訊有沒有顯示GPU裝置

gpu機器安裝nvidia-smi和python的tensorflow-gpu子產品

另外如果nvidia-smi碰到以下報錯，可以嘗試重新開機(反正我是這麼解決的。。)

Failed to initialize NVML: Driver/library version mismatch

轉載于:https://www.cnblogs.com/xingxiz/p/10685464.html

gpu機器安裝nvidia-smi和python的tensorflow-gpu子產品

繼續閱讀

libsvm for python 安裝

學習軟體測試基礎測試第七天

作業系統（python）多程序學習

Zeppelin 配置通路 REST APIApache Zeppelin Configuration REST API

【Torch】最簡潔logging使用指南

27. Remove Element(清單)題目代碼

ACS基本配置-權限等級管理

傳說FreeBSD等比Linux更穩定，更“健壯”

無人機--飛控科普

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Cloud Studio初體驗

使用 ctypes 進行 Python 和 C 的混合程式設計

【python】【資料處理】畫多元資料分布圖

【python】netconf協定對接管理裝置

「Python 網絡自動化」NETCONF —— Python 使用 NETCONF 管理配置 H3C 網絡裝置

在python中建立excel并寫入