天天看點

智能AI計算晶片對比

下面是本人接觸到的AI晶片,主要涉及華為、比特大陸-算豐、英偉達。其他還有寒武紀、地平線、瑞芯微等沒有接觸過就不對比了。

易開發性:比特大陸>英偉達>華為

性能:華為>英偉達>比特大陸(性能不是很好對比,每家實作的算子性能有差異,不能單純對比TOPS)

算力 記憶體 帶寬(GB/s) 解碼 編碼 功耗 備注
昇騰310 16TOPS INT8 LPDDR4x 8/4GB H.264/H.265 16路[email protected] [email protected] 1路[email protected] 9.5W Caffe/TensorFlow
Atlas300 [email protected] LPDDR4x 4x 8GB H.264/H.265 4x 16路[email protected] 4x [email protected] 4路[email protected] 67W
HI3559A [email protected][email protected] LPDDR4x 4GB 視訊:8路[email protected]:[email protected] 5W
算豐BM1880終端晶片 [email protected](Winograd算計可達[email protected]) LPDDR4 最大4GB 2路[email protected]:[email protected] 2.5W 多架構支援Caffe\ONNX
算豐BM1682雲端晶片 3TFLOPS 8路[email protected] 可堆疊多顆晶片
算豐SC1/SC1+ 2TFLOPs/4TFLOPs 16/32GB 50 1顆BM1680/2顆
Nvidia jetson TX2 [email protected] LPDDR4x 8GB D2D 35D2H/H2D 20 8路[email protected] 7.5W

實測BM1682 VS HI3559A(單NNIE)網絡有快有慢,并不是某個晶片一定快。

bm1682 hi3559a
YOLOv3_352x384 32.65ms 41.4ms
1 2 4
YOLOv3_288x320 19.31ms 33.74ms 61.17ms
mobilenetv2_288x320 3.16ms
MTCNN_16x56 0.246ms 0.193ms
CNN_48x168 0.649ms 3.75ms

繼續閱讀