下面是本人接触到的AI芯片,主要涉及华为、比特大陆-算丰、英伟达。其他还有寒武纪、地平线、瑞芯微等没有接触过就不对比了。
易开发性:比特大陆>英伟达>华为
性能:华为>英伟达>比特大陆(性能不是很好对比,每家实现的算子性能有差异,不能单纯对比TOPS)
算力 | 内存 | 带宽(GB/s) | 解码 | 编码 | 功耗 | 备注 |
---|---|---|---|---|---|---|
昇腾310 | 16TOPS INT8 | LPDDR4x 8/4GB | H.264/H.265 16路[email protected] [email protected] | 1路[email protected] | 9.5W | Caffe/TensorFlow |
Atlas300 | [email protected] | LPDDR4x 4x 8GB | H.264/H.265 4x 16路[email protected] 4x [email protected] | 4路[email protected] | 67W | |
HI3559A | [email protected][email protected] | LPDDR4x 4GB | 视频:8路[email protected]:[email protected] | 5W | ||
算丰BM1880终端芯片 | [email protected](Winograd算计可达[email protected]) | LPDDR4 最大4GB | 2路[email protected]:[email protected] | 2.5W | 多框架支持Caffe\ONNX | |
算丰BM1682云端芯片 | 3TFLOPS | 8路[email protected] | 可堆叠多颗芯片 | |||
算丰SC1/SC1+ | 2TFLOPs/4TFLOPs | 16/32GB | 50 | 1颗BM1680/2颗 | ||
Nvidia jetson TX2 | [email protected] | LPDDR4x 8GB | D2D 35D2H/H2D 20 | 8路[email protected] | 7.5W |
实测BM1682 VS HI3559A(单NNIE)网络有快有慢,并不是某个芯片一定快。
bm1682 | hi3559a | ||
---|---|---|---|
YOLOv3_352x384 | 32.65ms | 41.4ms | |
1 | 2 | 4 | |
YOLOv3_288x320 | 19.31ms | 33.74ms | 61.17ms |
mobilenetv2_288x320 | 3.16ms | ||
MTCNN_16x56 | 0.246ms | 0.193ms | |
CNN_48x168 | 0.649ms | 3.75ms |