下面是本人接觸到的AI晶片,主要涉及華為、比特大陸-算豐、英偉達。其他還有寒武紀、地平線、瑞芯微等沒有接觸過就不對比了。
易開發性:比特大陸>英偉達>華為
性能:華為>英偉達>比特大陸(性能不是很好對比,每家實作的算子性能有差異,不能單純對比TOPS)
算力 | 記憶體 | 帶寬(GB/s) | 解碼 | 編碼 | 功耗 | 備注 |
---|---|---|---|---|---|---|
昇騰310 | 16TOPS INT8 | LPDDR4x 8/4GB | H.264/H.265 16路[email protected] [email protected] | 1路[email protected] | 9.5W | Caffe/TensorFlow |
Atlas300 | [email protected] | LPDDR4x 4x 8GB | H.264/H.265 4x 16路[email protected] 4x [email protected] | 4路[email protected] | 67W | |
HI3559A | [email protected][email protected] | LPDDR4x 4GB | 視訊:8路[email protected]:[email protected] | 5W | ||
算豐BM1880終端晶片 | [email protected](Winograd算計可達[email protected]) | LPDDR4 最大4GB | 2路[email protected]:[email protected] | 2.5W | 多架構支援Caffe\ONNX | |
算豐BM1682雲端晶片 | 3TFLOPS | 8路[email protected] | 可堆疊多顆晶片 | |||
算豐SC1/SC1+ | 2TFLOPs/4TFLOPs | 16/32GB | 50 | 1顆BM1680/2顆 | ||
Nvidia jetson TX2 | [email protected] | LPDDR4x 8GB | D2D 35D2H/H2D 20 | 8路[email protected] | 7.5W |
實測BM1682 VS HI3559A(單NNIE)網絡有快有慢,并不是某個晶片一定快。
bm1682 | hi3559a | ||
---|---|---|---|
YOLOv3_352x384 | 32.65ms | 41.4ms | |
1 | 2 | 4 | |
YOLOv3_288x320 | 19.31ms | 33.74ms | 61.17ms |
mobilenetv2_288x320 | 3.16ms | ||
MTCNN_16x56 | 0.246ms | 0.193ms | |
CNN_48x168 | 0.649ms | 3.75ms |