天天看點

自動駕駛AI晶片火熱背後的冷思考

這是“汽車人參考”第373篇原創内容

“推動智能電動汽車向前進”

自動駕駛AI晶片火熱背後的冷思考

每個人現在和過去其實可以有非常奇妙的連結,去年這個時候還在為《一本書讀懂無人駕駛》新書作準備,以一篇有關晶片的科普文章作為20年結尾;一年後的今天,收到了出版社的樣書,适逢21年是自動駕駛AI晶片非常火熱的一年,是以在21年的結尾,為讀者分享有關AI晶片一些新的認知,也為新書年後上架做預熱。

回到初心:從CPU到GPU,再到AI晶片,都是為了快

CPU設計以低延遲為導向,通常由專為串行處理而優化的幾個核心組成,其微架構中大部分半導體用于建構控制電路和緩存,隻有少部分半導體進行運算,功能子產品多,擅長分支預測等複雜操作。

而GPU設計以吞吐量為導向,通常由數以千計的更小、更高效的核心組成,專為并行多任務設計,其微架構中,流處理器和顯存控制器占據絕大部分半導體,而控制器相對簡單,擅長對大量資料進行簡單操作。

目前自動駕駛計算機視覺領域,精度最高的AI算法是基于深度學習,常用卷積網絡(特斯拉98%的計算來自于卷積),其包含大量的卷積、殘差網絡、全連接配接等類型的計算,本質上都是矩陣或vector的乘法和加法。

從2006年開啟的深度學習熱潮,CPU與GPU都被用來進行AI計算,但由于神經網絡模型越來越大,計算面積更大的GPU優勢越來越明顯,特别是英偉達CUDA生态建立,使得GPU成了AI計算的專場,而CPU也逐漸失去了AI計算的商用價值。

但是,GPU設計之初是專門用來處理圖像的,其針對圖像渲染的計算算法與深度學習有很大的差別,内部大量的其他邏輯,對卷積的乘加法來說完全用不上,是以還是不能發揮出GPU的“快”,且GPU功耗較高、價格也很貴。

AI晶片,一般指針對CNN等典型深度學習算法而開發的專用晶片(ASIC),設計上是将更多的面積留給計算,要讓卷積乘加法的計算速度發揮到極緻。

需要指出的是,晶片上資料存儲在DRAM中,但從DRAM取資料很慢,卷積網絡又由很多層組成,在切換層的時候,乘加法邏輯又是休息的,是以,AI晶片也不能達到理論計算峰值,用軟體去優化硬體的作用更加凸顯。

軟體算法和晶片硬體有天生的沖突

軟體和硬體天生在開發節奏上就有沖突,算法疊代快而晶片開發慢,一款AI晶片從設計到面世的周期至少2年,而AI算法模型的疊代可以用月甚至是周來計算。

從2012年AlexNet的出現,深度學習算法主要進行了兩個階段的疊代。

下圖中每一個圈代表典型的深度學習算法,圈的大小表示參數量。

自動駕駛AI晶片火熱背後的冷思考

圖中橫軸表示計算量,代表着計算速度,縱軸表示精度,代表識别準确性;圖中越靠左,模型的計算量越小,說明計算越快,越靠上,模型精度越高,深度學習算法的核心就是要實作“又快又準。

深度學習算法第一個階段的疊代,主要是通過提升計算量來提升精度(圖右上角)。

大約到2017年,依靠這種方式的精度提升趨于飽和,是以學術界和業界開始轉向對計算效率的優化,即以較小計算量,去實作精度提升的第二階段。

在這個階段中,出現了Depthwise新的卷積形式,同時子結構上出現了自動搜尋,其中EfficientNet就是非常有代表性的模型結構,較好地實作了速度和精度的的折中。

算法還在疊代,未來不久transformer或許又會産生颠覆。

場景,場景,場景重要的事情說三遍

AI晶片有很多種類,有面向資料中心的,如英偉達的Orin、還有華為的晶片;而面對自動駕駛,AI晶片的設計又有很大不同。

自動駕駛檢測精度要求高(IoU=0.9),一般是對小物體檢測,意味着高分辨率輸入(大于800萬像素攝像頭)。

同時自動駕駛往往處理的是流資料,需要AI晶片保持全鍊路的低延時;AI任務也比較固定,主要以機器視覺為主;同時還要支援異構計算,而語義分割對帶寬的壓力也很大。

AI晶片對成本、散熱、可靠性、安全等車規要求很高,上車很關鍵。

自動駕駛AI晶片火熱背後的冷思考

提升計算效率,軟硬結合是唯一的手段

為了讓晶片計算“又快又準”,需要軟體和硬體緊密耦合,即“軟硬結合”已經成為了行業共識,但實作的路徑往往不一樣。

比較好的實踐是需要時刻關注算法模型的發展,對深度學習技術本身保持深刻的洞察,從實際應用場景出發,通過benchmark等方式才能押對寶。

而在硬體架構設計初期,就要兼顧軟體的發展,通過硬體架構和軟體算法之間的工具,通過性能仿真預估、去快速的疊代,逐漸積累相關的know-how。

汽車人參考小結

以終為始來看,AI晶片及相關産業鍊最終肯定要國産,是以這是一條超過十年的賽道,單從目前做晶片硬體的競争格局來看,國際國外前幾位玩家,其身位都已經站好,還有做軟體的玩家也對晶片躍躍欲試。

更需要在變化中去尋找不變的因素,在沒有競争的地方去競争,讓成敗決定于交手之前。

本文為汽車人參考第373篇原創文章,如果您覺得文章不錯,“推薦和關注”是對我最大的支援。

自動駕駛AI晶片火熱背後的冷思考

國産晶片真危機,美國三巨頭壟斷,晶片之母EDA是什麼

繼續閱讀