在執行,
python samples/coco/coco.py train --dataset=. --model=coco
運作幾步之後,就報如下錯誤,導緻訓練終止。
floating point exception(core dumped)
試了很多辦法都不行,最後在github上提問得到了兩位大牛的解答。
我原來的環境是tensorflow1.7.0,cuda8.0,cudnn6.0。
解決辦法是将tensorflow更新到1.9.0,cuda更新到9.0,cudnn更新到7.0。
更新tensorflow的辦法:
pip uninstall tensorflow-gpu
pip install tensorflow-gpu==1.9.0
解除安裝舊版cuda安裝新版cuda的方法請參考連結: linux ubuntu16.04 解除安裝cuda8.0 安裝cuda9.0。
現在已經可以正常訓練了。