圖像識别深度學習主流方案平台比較

嵌入式AI主要用于圖像識别和語音識别，圖像識别主要用于工業、自動化、醫療等行業。以醫療行業為例，由于醫療保健行業大量使用大資料及嵌入式人工智能，進而精準改善疾病診斷、醫療人員與患者之間人力的不平衡、降低醫療成本、促進跨行業合作關系。此外嵌入式人工智能還廣泛應用于臨床試驗、大型醫療計劃、醫療咨詢與宣傳推廣和銷售開發。嵌入式人工智能導入醫療保健行業從2016年到2022年維持很高成長，預計從2016年的6.671億美元達到2022年的79.888億美元年均複合增長率為52.68％。（嵌入式AI圖像識别市場資料來源參考）

多家半導體廠商已經推出嵌入式AI平台，比如

華為海思今年4月份釋出的Hi3559A，這個樣品超過100美金/片
內建寒武紀AI核（遺憾不是最新的版本，因為最近寒武紀又釋出最新的AI版本，同時還內建大名鼎鼎Cadence的 4核DSP）；
賽靈思Xilinx的FPGA—— Zynq 7020，ZU2CG開發難度大，價格不菲，還有其他家的ARM+FPGA方案也不便宜，開發難度也不小；
英偉達的GPU——JETSON TX2，TX2核心闆英偉達自己生産，價格太貴，不适合産品小型化生産；
TI 的TDA2x系列和DAVINCI系列最新的DM505，以及後續的版本，專注輔助駕駛ADAS，他的64bit浮點DSP C66X+EYE也支援深度學習（不要小瞧EYE，深度學習一個EYE比2個C66X 浮點DSP還強），不過功耗太高，軟體資源也不好搞到，海掏買美國D3公司DEMO闆價格不菲，而且沒技術支援開發周期過長,價格也不便宜。
Intel的Movidius Myriad 2，在軟體資源方面,Intel推出神經計算棒的免費NCSDK，這個軟體資源讓很多公司看到嵌入AI領域的希望，很多公司都在嵌入式開發闆樹莓派3上面加這個神經計算棒學習。

華為海思Hi3516A/D + VPU和Hi3519V101+VPU，因為海思Hi3516A/D和Hi3519V101支援H.264/H.265編解碼，帶有ISP，還帶有一個IVE（智能視訊分析算法加速器，确切的說是傳統機器視覺算法加速器），然後再加上Intel Movidius 這個支援深度學習的VPU，就是上海速嵌智造的可深度定制開發的ARM+VPU深度學習平台。也就是說同時支援傳統機器視覺算法+深度學習算法，而且還支援H.265編解碼。

海思Hi3516A/D和Hi3519V101的IVE支援的功能太過技術細節，将另文講述。

Movidius Myriad 2 VPU (Vision Processing Unit——視覺處理器)被稱作為“第三次影像革命的開端”的晶片方案。Movidius 已經被Intel收購，Intel Movidius Myriad 2 VPU可在不同目标應用中提供低功耗、高性能的視覺處了解決方案，其中包括嵌入式深度神經網絡、位姿估計、室内導航、3D深度感應、3D制圖（3D掃描模組化），視覺慣性測距，以及手勢/眼部跟蹤，基于深度學習的環境感覺。

安防巨頭海康和大華把Movidius Myriad 2(MA2450)視覺處理單元應用于視訊監控攝像頭，在完成監控和錄制等傳統任務外，提供人群密度監測、立體視覺、面部識别、人數統計、行為分析以及檢測非法停放車輛等先進的視訊分析功能。Myriad 2為大疆最近釋出的首款迷你無人機Spark提供了視覺智能技術，大批量生産。

這顆晶片被一分為二，其中一部分有12個SHAVE 128位處理器，專為影像處理負載做優化，每顆都運作在600MHz的頻率下，而且有超頻潛能，第一代的180MHz顯然是不夠看的；與這些處理器相比對的是Movidius稱之SIPP過濾器（Streaming Inline Processing Pipeline filters）的硬體加速器——可完成一些預設的影像處理任務，比如将來自不同類型攝像頭的資料融合到一起，或者将多個視訊内容接合到一起；另外還有2個32位RISC處理器用于晶片管理，這就是LEON4(LEON是一款32位RISC處理器，支援SPARC V8指令集，由歐洲航天總局旗下的Gaisler Research開發、維護，目的是擺脫歐空局對美國航天級處理器的依賴。LEON的主要産品線包括LEON2、LEON3、LEON4)。SHAVE這一端對原始影像資料做計算處理，OEM廠商可以選擇不同的方案；SIPP則可協力處理通常任務；集中型的寄存器結構令晶片兩側可同時對相同的資料做處理。這些對于降低延遲是相當有價值的。

鑒于這樣的架構設計，Myriad 2 VPU晶片面積是6.5mm，厚度1mm，具體的性能則是可以48fps的幀率同時處理來自12個1300萬像素攝像頭的資料，以60fps拍攝4K視訊自然也是毫無壓力，功耗低于0.5W(台積電28nm HPC工藝)。按照El-Ouazzane的說法，相比能夠提供同等效果的GPU，Myriad 2的功耗低了最少10倍。

深度學習架構方面，支援Caffe,Caffe的全稱是Convolutional Architecture for Fast Feature Embedding，是一個清晰、高效的開源深度學習架構，核心語言是C++，支援指令行、Python和Matlab接口，既可以在CPU上運作也可以在GPU上運作。同時也支援Google的TensorFlow。是以C/C++、Python程式員可以快速切入深度學習的架構去工作。前面提到的Intel Movidius神經元棒，包括他們提供的免費NCSDK軟體包，可以滿足那些C/C++程式員、Python程式員輕松在WIN下直接開發AI軟體，也可以在ubuntu下直接開發軟體，很友善，而在嵌入式前端，同樣也可以支援NCSDK軟體包，熟悉Caffe和TensorFlow應該很快上手進行算法優化和設計。

而2017年推出的Movidius Myriad X(MA2485)将提供十倍于Myriad 2同樣功率範圍内深層神經網絡(DNN)的性能。

圖像識别深度學習主流方案平台比較

嵌入式AI MA2485

Myriad X 有4個可C程式設計的128位VLIW矢量處理器和可配置的MIPI通道，并擴充了2.5 MB的晶片記憶體和更多的固定功能成像/視覺加速器。就像在Myriad X中發現的一樣，Myriad X的矢量機關都是專有的SHAVE (流混合的架構矢量引擎)處理器，對計算機視覺工作負載進行了優化。Myriad X也支援最新的LPDDR4，MA2085變體隻配置了外部存儲器接口。

Myriad X的另一個新功能是4K硬體編碼，4K在30Hz(H.264/H.265)和60 Hz(M/JPEG)支援。從接口上看，Myriad X帶來了USB 3.1和PCIe 3.0支援，這兩個都是Myriad VPU家族新支援的接口。與Myriad 2一樣，所有這些都是在同一個小于2W的功率範圍中完成的，更具體地說是在1W以内，使用台積電16nm FFC工藝。是以說，在如此低功耗下就能完成很多視訊處理和深度學習，前面提到的幾個平台根本無法做到。

從目前前端圖像識别市場回報的角度看，這個Myriad 2 VPU(MA2450) 和 Myriad X VPU(MA2485)晶片出貨量比較大。在開發闆-學習闆方面，樹莓派3+可以直接拿神經計算棒進行深度學習算法開發。如果是産品設計，速嵌智造推薦ARM + VPU方案可以快速定制開發出産品。我們在HI3516D+VPU和Hi3519V101+VPU闆上測試：

圖像識别深度學習主流方案平台比較

圖像識别深度學習主流方案平台比較

繼續閱讀

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

與專家面對面：Android開發入門問與答

新鮮傳媒CEO紀中展：經濟危機對年輕人是機會新鮮傳媒CEO紀中展：經濟危機對年輕人是機會紀中展：加入創業團隊初期不要考慮名利紀中展：創業者骨子裡要有霸氣紀中展：創業是颠覆過去的過程

《eWEEK》：09年5大科技發展趨勢雲計算居首

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普

Linux裝置模型（中）之上層容器