因為現在做的一個項目需要同時加載多個模型,而給的顯示卡又太渣了,加載不了幾個就OOM了,查資料發現可以使用cpu來預測,使用cpu時是使用記憶體而不是使用顯存,正好給的伺服器的記憶體很大,是以這裡記錄一下
- tensorflow版本:2.4.2
- 顯示卡:NVIDIA Quadro P620
- 顯存:2G
- 記憶體:128G
- 解決:執行
os.environ["CUDA_VISIBLE_DEVICES"] = "-1"`
之後預測會使用cpu計算而不是gpu,會使用記憶體而不是使用顯存。