天天看點

圖像識别深度學習主流方案平台比較

嵌入式AI主要用于圖像識别和語音識别,圖像識别主要用于工業、自動化、醫療等行業。以醫療行業為例,由于醫療保健行業大量使用大資料及嵌入式人工智能,進而精準改善疾病診斷、醫療人員與患者之間人力的不平衡、降低醫療成本、促進跨行業合作關系。此外嵌入式人工智能還廣泛應用于臨床試驗、大型醫療計劃、醫療咨詢與宣傳推廣和銷售開發。嵌入式人工智能導入醫療保健行業從2016年到2022年維持很高成長,預計從2016年的6.671億美元達到2022年的79.888億美元年均複合增長率為52.68%。(嵌入式AI圖像識别市場資料來源參考)

多家半導體廠商已經推出嵌入式AI平台,比如

  • 華為海思今年4月份釋出的Hi3559A,這個樣品超過100美金/片
  • 內建寒武紀AI核(遺憾不是最新的版本,因為最近寒武紀又釋出最新的AI版本,同時還內建大名鼎鼎Cadence的 4核DSP);
  • 賽靈思Xilinx的FPGA—— Zynq 7020,ZU2CG開發難度大,價格不菲,還有其他家的ARM+FPGA方案也不便宜,開發難度也不小;
  • 英偉達的GPU——JETSON TX2,TX2核心闆英偉達自己生産,價格太貴,不适合産品小型化生産;
  • TI 的TDA2x系列和DAVINCI系列最新的DM505,以及後續的版本,專注輔助駕駛ADAS,他的64bit浮點DSP C66X+EYE也支援深度學習(不要小瞧EYE,深度學習一個EYE比2個C66X 浮點DSP還強),不過功耗太高,軟體資源也不好搞到,海掏買美國D3公司DEMO闆價格不菲,而且沒技術支援開發周期過長,價格也不便宜。
  • Intel的Movidius Myriad 2,在軟體資源方面,Intel推出神經計算棒的免費NCSDK,這個軟體資源讓很多公司看到嵌入AI領域的希望,很多公司都在嵌入式開發闆樹莓派3上面加這個神經計算棒學習。

華為海思Hi3516A/D + VPU和Hi3519V101+VPU,因為海思Hi3516A/D和Hi3519V101支援H.264/H.265編解碼,帶有ISP,還帶有一個IVE(智能視訊分析算法加速器,确切的說是傳統機器視覺算法加速器),然後再加上Intel Movidius 這個支援深度學習的VPU,就是上海速嵌智造的可深度定制開發的ARM+VPU深度學習平台。也就是說同時支援傳統機器視覺算法+深度學習算法,而且還支援H.265編解碼。

海思Hi3516A/D和Hi3519V101的IVE支援的功能太過技術細節,将另文講述。

Movidius Myriad 2 VPU (Vision Processing Unit——視覺處理器)被稱作為“第三次影像革命的開端”的晶片方案。Movidius 已經被Intel收購,Intel Movidius Myriad 2 VPU可在不同目标應用中提供低功耗、高性能的視覺處了解決方案,其中包括嵌入式深度神經網絡、位姿估計、室内導航、3D深度感應、3D制圖(3D掃描模組化),視覺慣性測距,以及手勢/眼部跟蹤,基于深度學習的環境感覺。

安防巨頭海康和大華把Movidius Myriad 2(MA2450)視覺處理單元應用于視訊監控攝像頭,在完成監控和錄制等傳統任務外,提供人群密度監測、立體視覺、面部識别、人數統計、行為分析以及檢測非法停放車輛等先進的視訊分析功能。Myriad 2為大疆最近釋出的首款迷你無人機Spark提供了視覺智能技術,大批量生産。

這顆晶片被一分為二,其中一部分有12個SHAVE 128位處理器,專為影像處理負載做優化,每顆都運作在600MHz的頻率下,而且有超頻潛能,第一代的180MHz顯然是不夠看的;與這些處理器相比對的是Movidius稱之SIPP過濾器(Streaming Inline Processing Pipeline filters)的硬體加速器——可完成一些預設的影像處理任務,比如将來自不同類型攝像頭的資料融合到一起,或者将多個視訊内容接合到一起;另外還有2個32位RISC處理器用于晶片管理,這就是LEON4(LEON是一款32位RISC處理器,支援SPARC V8指令集,由歐洲航天總局旗下的Gaisler Research開發、維護,目的是擺脫歐空局對美國航天級處理器的依賴。LEON的主要産品線包括LEON2、LEON3、LEON4)。SHAVE這一端對原始影像資料做計算處理,OEM廠商可以選擇不同的方案;SIPP則可協力處理通常任務;集中型的寄存器結構令晶片兩側可同時對相同的資料做處理。這些對于降低延遲是相當有價值的。

鑒于這樣的架構設計,Myriad 2 VPU晶片面積是6.5mm,厚度1mm,具體的性能則是可以48fps的幀率同時處理來自12個1300萬像素攝像頭的資料,以60fps拍攝4K視訊自然也是毫無壓力,功耗低于0.5W(台積電28nm HPC工藝)。按照El-Ouazzane的說法,相比能夠提供同等效果的GPU,Myriad 2的功耗低了最少10倍。

深度學習架構方面,支援Caffe,Caffe的全稱是Convolutional Architecture for Fast Feature Embedding,是一個清晰、高效的開源深度學習架構,核心語言是C++,支援指令行、Python和Matlab接口,既可以在CPU上運作也可以在GPU上運作。同時也支援Google的TensorFlow。是以C/C++、Python程式員可以快速切入深度學習的架構去工作。前面提到的Intel Movidius神經元棒,包括他們提供的免費NCSDK軟體包,可以滿足那些C/C++程式員、Python程式員輕松在WIN下直接開發AI軟體,也可以在ubuntu下直接開發軟體,很友善,而在嵌入式前端,同樣也可以支援NCSDK軟體包,熟悉Caffe和TensorFlow應該很快上手進行算法優化和設計。

而2017年推出的Movidius Myriad X(MA2485)将提供十倍于Myriad 2同樣功率範圍内深層神經網絡(DNN)的性能。

圖像識别深度學習主流方案平台比較

嵌入式AI MA2485

Myriad X 有4個可C程式設計的128位VLIW矢量處理器和可配置的MIPI通道,并擴充了2.5 MB的晶片記憶體和更多的固定功能成像/視覺加速器。就像在Myriad X中發現的一樣,Myriad X的矢量機關都是專有的SHAVE (流混合的架構矢量引擎)處理器,對計算機視覺工作負載進行了優化。Myriad X也支援最新的LPDDR4,MA2085變體隻配置了外部存儲器接口。

Myriad X的另一個新功能是4K硬體編碼,4K在30Hz(H.264/H.265)和60 Hz(M/JPEG)支援。從接口上看,Myriad X帶來了USB 3.1和PCIe 3.0支援,這兩個都是Myriad VPU家族新支援的接口。與Myriad 2一樣,所有這些都是在同一個小于2W的功率範圍中完成的,更具體地說是在1W以内,使用台積電16nm FFC工藝。是以說,在如此低功耗下就能完成很多視訊處理和深度學習,前面提到的幾個平台根本無法做到。

從目前前端圖像識别市場回報的角度看,這個Myriad 2 VPU(MA2450) 和 Myriad X VPU(MA2485)晶片出貨量比較大。在開發闆-學習闆方面,樹莓派3+可以直接拿神經計算棒進行深度學習算法開發。如果是産品設計,速嵌智造推薦ARM + VPU方案可以快速定制開發出産品。我們在HI3516D+VPU和Hi3519V101+VPU闆上測試:

圖像識别深度學習主流方案平台比較
上一篇: vue 入門筆記
下一篇: va_x

繼續閱讀