天天看點

平頭哥玄鐵斬獲AI榜單4項第一,RISC-V走在生态繁榮前夜

阿裡平頭哥重新整理MLPerf榜單紀錄,也是RISC-V迎來春天的信号。

作者 | 包永剛

編輯 | 王川

市場和資本對AI的态度回歸理性之時,AI上司者們之間的較量也變得愈加激烈。

一個很明确的信号是,目前全球最權威的AI基準測試(Benchmark)之一MLPerf,其基準測試成績正在被你追我趕的AI上司者們不斷重新整理。

作為現有的50多家MLPerf基準測試聯盟成員之一,阿裡巴巴此前已經在MLPerf資料中心基準測試中斬獲多項第一。在本月最新釋出的MLPerf Tiny v0.7榜單中,基于平頭哥玄鐵RISC-V C906處理器的軟硬體聯合優化方案,取得了全部4個名額的第一。

RISC-V國際基金會CEO Calista Redmond對此表示:“物聯網(IoT)領域的AI技術競争激烈,不同層面的定向優化對于以極低功耗取得新突破至關重要。阿裡此次的工作證明了其在RISC-V産業的上司者地位,也給全球RISC-V社群和生态的發展提供了信心。”

已經在MCU市場攻城略地,給Arm帶來不小壓力的RISC-V處理器,在阿裡平頭哥玄鐵的進一步推動下,很大程度證明了RISC-V在IoT市場的發展潛力,RISC-V在IoT領域的優勢不容忽視。

從整個RISC-V發展的層面來看,相對年輕的RISC-V仍然有很多挑戰和需要提升的地方,但随着英特爾、蘋果、谷歌等業界有影響力的公司在RISC-V領域邁出的關鍵一步,加上阿裡巴巴、西部資料在RISC-V生态建中取得的成果,RISC-V站在生态繁榮的前夜,即将迎來春天,RISC-V處理器應用市場将從優勢确立的AIoT,進一步拓展至汽車、工業等領域。

1

平頭哥玄鐵斬獲四項第一的秘密

——系統級優化

MLPerf在AI火熱的2018年12月首次釋出基準測試,随後迅速得到了各大公司、科研機構和高校支援和參與。此後,MLPerf基準測試不斷完善,基準測試也從最初的AI訓練,拓展至資料中心、邊緣、智能手機和IoT的AI推理基準測試,參與者越來越多,競争也越來越激烈。

MLPerf Tiny 是最新的基準測試榜單,聚焦低功耗、高成本效益的IoT場景,2021年6月首次釋出V0.5基準測試結果,本月最新的MLPerf Tiny V0.7榜單出爐。

平頭哥玄鐵斬獲AI榜單4項第一,RISC-V走在生态繁榮前夜

MLPerf Tiny V0.7的榜單中,CPU的架構涵蓋了Arm、RISC-V架構和自研架構,平頭哥霸榜足以說明RISC-V架構CPU的AI能效比優勢。

最終的成績顯示,阿裡自研RISC-V玄鐵C906處理器的軟體硬體聯合優化性能結果,在不使用加速器的情況下,滿足精度要求的同時,全部4個基準測試(喚醒、圖像分類、語音喚醒及異常監測)的性能資料均位列第一,重新整理了MLPerf Tiny Open的全部4個基準測試記錄。

雷峰網注意到,在MLPerf Tiny V0.7的四個測試中,阿裡平頭哥玄鐵的成績比其它送出者的性能至少高10倍。也就是說,相比其他送出者,平頭哥玄鐵的性能有一個數量級的優勢。

能夠實作如此顯著的優勢可以概括為——軟硬一體創新。

平頭哥玄鐵斬獲AI榜單4項第一,RISC-V走在生态繁榮前夜

MLPerf Tiny V0.7性能資料對比

平頭哥副總裁孟建熠對雷峰網表示,“我們能夠重新整理MLPerf Tiny榜單,是因為平頭哥聯合了阿裡雲、達摩院等多個部門,進行了從最底層硬體到編譯再到上層算法的軟硬體協同創新。”

最底層的硬體,玄鐵C906是業界最早量産的向量擴充RISC-V指令集處理器,也是一款64位高能效處理器,标配記憶體管理單元。針對AI處理的特點,C906在資料預取上做了優化,采用多通道多模式的資料預取技術,可大幅提升資料通路帶寬。

編譯層面,平頭哥進一步優化神經網絡模型部署工具集HHB及加速庫CSI-NN2,二者配合,能簡單快速的将原始單精度浮點模型量化為開發闆上性能最優的資料類型。同時,CSI-NN2 在實作神經網絡算子時,充分考慮到玄鐵C906的硬體特性(包括流水線、高速緩存等),充分挖掘了FP16 資料格式在算法中的并行能力,發揮出玄鐵硬體的高能效優勢。

平頭哥玄鐵斬獲AI榜單4項第一,RISC-V走在生态繁榮前夜

在離開發者更近的算法層面,借助阿裡雲震旦異構加速平台利用架構感覺的模型優化工具SinianML,通過壓縮、網絡結構搜尋、蒸餾、彈性伸縮等優化,使AI推理實作了計算效率的大幅提升。同時,結合達摩院在語音和視覺AI算法方面的領域知識,在具體任務上通過算法優化實作加速。

“在MLPerf Tiny榜單中取得4項第一,證明了RISC-V在性能及能效方面非常優異的潛力,也展現出了RISC-V在高能效AI進行中非常有價值。”孟建熠說:“RISC-V架構更靈活,更能滿足AIoT時代定制化需求。”

2

RISC-V确立AI優勢,将迅速占領AIoT市場

過去幾年間,憑借着可定制化以開放開源的優勢,比肩Arm Cortex-M0甚至Cortex-M4的RISC-V處理器産品上市,給Arm帶來了不小的壓力。

2017 年圖靈獎得主,也是帶領伯克利加州大學團隊在2011年釋出RISC-V(第五代精簡指令集)的David Patterson教授2020年時對雷峰網說,“正如今天的Linux是專有作業系統的強大競争對手一樣,我希望開放的RISC-V架構在未來五年内成為專有處理器架構的非常強大的競争對手。它可能從物聯網産品開始,但我希望RISC-V從智能手機、筆記本電腦到高性能計算,在各個層級都變得非常有競争力。”

RISC-V國際基金會董事譚章熹曾對雷峰網表示:“新的應用總會伴随新的技術和機會,就算不替代Arm,RISC-V架構的AI晶片無疑也是IoT時代的重要玩家。我覺得真正有意思的是,RISC-V開始慢慢對Arm新推出的物聯網晶片進行一些替代。”

平頭哥玄鐵斬獲AI榜單4項第一,RISC-V走在生态繁榮前夜

RISC-V的AI優勢在此次榜單中正是一個很好的展示,玄鐵C906作為一款CPU,在不借助加速器的情況下,就實作了比其它架構CPU配合加速器更高的AI性能。

“平頭哥的定位是提供RISC-V原生的AI支援,是以我們所有的基準測試都是由CPU來完成。”孟建熠說,“基于玄鐵處理器能效的表現,很多對AI算力要求不高的IoT場景(1TOPS以下)就不需要在單獨設計AI加速器,無論是成本、可調試性、可開發性都非常友好。如果是對AI有更高要求的客戶,也可以開發單獨的AI加速器。”

據悉,在語音AI場景,達摩院語音實驗室聯合平頭哥打造了基于RISC-V玄鐵C906核的語音互動AIoT模組,可以為客戶整機降低一半以上的模組成本,同時依然保持高性能的算法體驗,已經服務于天貓精靈等内外部客戶,結合有25億顆累積應用的玄鐵CPU生态,能夠為更多的智能裝置帶來低功耗和高成本效益的AI技術。

接下來,平頭哥還将繼續通過軟硬體的協同創新不斷增強RISC-V的AI優勢。

這一點從平頭哥選擇的MLPerf Tiny V0.7 Open Division就可以明确看出。MLPerf Tiny分為Closed Division 和Open Division。Closed Division隻能從底層做模型的量化和算子加速。Open Division則可以從模型層次結構、網絡結構等更大範圍内的優化,MLPerf也希望通過Open Division鼓勵創新。

孟建熠說,“相較于Closed Division,Open Division更能展現軟硬協同的能力。長期來看,我們可能還是會堅持從Open Division的角度不斷優化和提升玄鐵RISC-V處理器的AI性能。”

RISC-V從技術層面的不斷創新,也能夠更好地符合IoT市場碎片化的需求。

平頭哥生态負責人楊靜表示,“我們軟硬協同優化和創新的模式從某種角度看是可以複制的模式。我們也希望在更多的行業裡,更懂應用的客戶能夠把上層的軟體優化做好,從應用出發,通過軟硬體配合提升能效,不斷豐富RISC-V的生态。”

孟建熠認為,“在IoT領域,RISC-V的技術和生态進入了快速發展的階段。但RISC-V除了IoT還要走向邊緣、資料中心等市場,這需要生态的繁榮。”

3

走在生态繁榮前夜,RISC-V将迎來春天

正如Arm花費了數年時間建立伺服器CPU生态,才在最近幾年能有與x86伺服器CPU競争的機會一樣。生态的豐富和完善程度決定了RISC-V真正的競争力。RISC-V建設生态的優勢在于,與x86的封閉,以及Arm的授權模式不同,RISC-V在晶片領域全新的開放、可定制化能夠吸引更多開發者。

孟建熠認為,生态繁榮的一些關鍵特征包括,有足夠數量的開發者,有足夠豐富的軟體,以及足夠的可供使用的資源。RISC-V的整個生态走在了繁榮的前夜。

最近一年,越來越多業界有影響力的公司在推動RISC-V發展中邁出了實質性的一步,足以說明RISC-V未來的潛力。比如x86架構的主導者英特爾在今年2月宣布加入RISC-V International,并成為Premier級别會員。谷歌在去年10月釋出的自研獨立安全晶片,改用RISC-V指令集架構。蘋果在去年9月放出了RISC-V人才的招聘資訊。

作為RISC-V的上司者之一,平頭哥對RISC-V生态的繁榮已經做出了重要貢獻。2021年10月13日,平頭哥宣布玄鐵C910成功相容安卓系統,可運作Chrome浏覽器等應用。這是RISC-V架構處理器首次實作對安卓的支援,意味着RISC-V架構有望打破場景壁壘,成為高性能晶片設計的新選擇。

平頭哥玄鐵斬獲AI榜單4項第一,RISC-V走在生态繁榮前夜

2021年10月13日,平頭哥玄鐵C910成功相容安卓系統

性能和應用不斷向上突破的同時,平頭哥已經擁有從低功耗、低成本到中高性能等豐富的RISC-V處理器産品家族,廣泛應用于MCU、藍牙、無線、語音、視覺等應用場景。目前,玄鐵系列處理器已出貨超25億顆,擁有150餘家客戶、超500個授權數,是國内應用規模最大的國産CPU。

除了從技術次元進行創新,平頭哥從商業模式次元的創新也對RISC-V生态的繁榮意義重大。

RISC-V一個顯著的特性就是開源,平頭哥也通過開源開放推進算力普及。2019年,玄鐵C910一面世就對外開放,2021年玄鐵4款量産處理器全棧開源,為全球開發者提供了架構新選擇,在此基礎上,開發者可實作開源EDA協同,創新硬體架構,豐富軟體應用生态。

過去幾年間,平頭哥适配了AliOS、FreeRTOS、RT-Thread、Linux、Android等作業系統,在百餘款晶片中得到了應用。這也使得玄鐵系列成為國内RISC-V領域影響力和市場占有率最大的處理器産品,以每年50%的授權數增長。

楊靜介紹,“玄鐵處理器不斷豐富的同時,也有越來越多可供開發者群體使用的開發。我們會逐漸增加可使用開發闆的觸達度。可以看到,基于這些開發闆開發的項目不止有創意,也有一些真正進入IoT商業化領域的嘗試。”

高校更能夠在人才培養的階段就普及RISC-V技術。孟建熠說,“4款玄鐵處理器全棧開源之後,許多科研院所,以及國内知名的高校都基于玄鐵做研究,也已經有玄鐵架構的分析論文。當然,我們也和高校合作,在計算機體系結構課程中增加玄鐵處理器的相關内容。”

“開源之後,我們看到更多的初創公司,甚至一些大公司都會看我們開源核心的使用情況。玄鐵處理器的開源代碼在GitHub的下載下傳量相當可觀。”楊靜補充表示。

RISC-V的生态在業界的共同努力下,正在走向繁榮,這也意味着RISC-V市場即将迎來春天。

AIoT市場之後,在可以預見的未來,RISC-V的下一個戰場或許是車載和工業市場。将時間線拉長,RISC-V也将在雲端和邊緣端高性能處理器市場占有一席之地。

END

繼續閱讀