天天看點

資料中心CPU晶片,ARM可堪重負?

作者:中芯科技
資料中心CPU晶片,ARM可堪重負?

資料中心是算力的聚集地,絕大多數算力都聚焦在超算中心、資料中心并以伺服器釋放到千行百業。在行業數字化及國産化程序中,x86、ARM及RISC-V等各種架構派系處理器、伺服器、加速器都以獨特技術優勢在資料中心散發着“光”和“熱”。

本文從資料中心晶片占比、應用生态相容、性能、技術演進等次元着手,分析國内基于ARM晶片廠商的行業相容性及應用生态現狀。

一、超算中心現狀及晶片占比

縱觀超算中心,從第60屆TOP500榜單資料顯示,Intel仍然是超算系統中最大的處理器廠商,占有率達到75.80%,Xeon晶片超算系統中應用普遍,最新入榜的Leornardo采用的就是Xeon Platinum處理器。AMD處理器是受歡迎的HPC系統晶片,其占有率20.20%,且占有率持續增長(從18.60%上升至20.20%)。TOP500系統中有101個系統采用AMD處理器,例如排名第一的Frontier和排名第三的LUMI。從TOP500榜單資料來看,基于Intel和AMD的x86架構CPU占據超算中心96%系統份額。不難了解,超算中心重點考量名額就是算力(Benchmark)和系統性能(業務Workload),這正是以x86為代表的複雜指令集的強項。從算力角度講,CPU乃至伺服器架構設計決定算力,尤其是浮點及雙精度運算能力,即64位浮點數字的計算(FP64);排名第一的Frontier超算系統就基于HPE Cray EX架構,第三代AMD EPYC處理器保證極高性能。但系統性能方面,在如天氣預報等精度要求極高仿真行業,不僅需要超高算力,還需相容CPU架構的商業軟體保證系統性能,行業及CPU架構高度優化過的商業軟體才能保證系統性能、業務效率及準确度。

從《開放架構HPC技術與生态白皮書》可得知,超算及資料中心應用生态的行業,例如油氣、制造CAE等行業以商業軟體為主,涉及核心算法、實踐經驗積累,對結果精準的要求并非開源軟體可替代,x86架構對商業軟體支援的完備度最高。

二、ARM資料中心份額及生态

在超算中心,ARM處理器表現平平;雖然日本Fugaku系統 TOP500榜單排名第二,但該系統并非通常意義上的ARM架構,而是由富士通基于超算優化版的A64FX處理器。市場佔有率上,ARM屬于Others陣營,與RISC-V等架構同屬4%行列。在資料中心,x86市場佔有率依然堅挺,據IDC資料,Intel和AMD x86合計市占率91%;ARM在依然屬于Others陣營;但在非X86領域,ARM以低能耗、高效率、發展時間長的優勢占據移動終端市場的主導地位,使用最廣泛、發展最成熟,市占率達到43.2%,遠高于RISC-V 9%。在移動終端方面,ARM占據絕對優勢。

回歸到RAM生态,ARM在HPC行業應用系統相容生态完備度較強,如教育、氣象、生命等重要的科學計算領域中都有開源軟體ARM 指令集版本,少量或無需開發即可完成軟體移植。然而,在傳統行業,如智慧城市、資料庫、中間件等應用受限細分行業及場景差異性,相容複雜性等諸多因素,相容覆寫度略顯不足,一般按需定制開發。

三、ARM晶片架構及玩家分析

ARM作為精簡指令集,其優勢在功耗比,結合其在移動終端領域市場優異表現,決定主要應用在移動和嵌入式市場。從功耗來講,對于單CPU的手機采用arm來降低功耗效果是非常明顯的;但在資料中心、超算中心,伺服器結構複雜,如磁盤、加速卡等數量遠高于CPU,這導緻伺服器的主要功耗不在CPU,是以,衡量資料中心能耗的方式也與移動終端不同。資料中心有專有冷卻裝置保證資料中心的整體能耗:PUE,如超算中心Green10排名第3的Adastra系統(319,072核,HPE Cray EX235a),相比

Setonix- GPU系統(181,248核,HPE Cray EX235a),CPU核數更多,Green10排名反而更靠前。

資料中心CPU晶片,ARM可堪重負?

在性能上,ARM晶片依靠多核心堆砌,單核性能相對薄弱(單CPU堆至64核),尤其在雙精度浮點運算總體比不上x86架構晶片性能。由于新型XPU加速卡算法、算子庫都基于x86開發,難以通過加速卡在ARM架構上進行性能加速。制于ARM晶片性能、生态原因,桌面PC發展也受到一些限制。國産ARM晶片在PC電腦的應用更為慘淡,目前主要為飛騰PKS體系内。

在人工智能背景下,ARM除了性能、生态的本身問題外,V9架構疊代的延續性問題導緻在資料中心領域發展空間受限目前國産Arm架構CPU伺服器玩家大體分為華為的鲲鵬系和中電子的飛騰系。飛騰、華為等公司已掌握 Arm64 處理器核、微架構及晶片設計相關技術。華為釋出了一系列基于 Arm 架構的伺服器産品,如2019釋出的鲲鵬920,作為7nm資料中心ARM處理器,專為大資料處理以及分布式存儲等應用而設計。而飛騰則建立了PKS體系,主要也用于伺服器産品,分為高性能伺服器晶片、高效能桌面晶片和高端嵌入式晶片,現在移動終端市場占據統治地位。

四、ARM、RISC-V困境及國産發展之道

目前國内六家主流CPU廠商鲲鵬、飛騰、兆芯、龍芯、海光、申威紛紛發力,從國外引進各種不同技術架構如ARM、X86、MIPS等;八仙過海各顯神通。國産CPU産業産生了三種不同的路線,海光和兆芯基于x86指令集在商業應用領域更具優勢,龍芯和申威依靠自主研發的優勢在特種應用場景上受到青睐,鲲鵬、飛騰基于ARM架構,在具有優勢的特定賽道尋找超車的機會。相比占據壟斷地位的x86指令集,ARM指令集本身作為彎道超車思維的産物。ARM指令集的優點在于功耗小,能效比優秀,打開了移動端裝置和消費類電子的市場,這也跟ARM在移動終端的市場優異表現一緻。鲲鵬系主要是以華為自家TaiShan系列伺服器為核心,向伺服器合作廠商(如神州數位、寶德等)出售鲲鵬主機闆。近兩年在鲲鵬和飛騰的大力推動下,國内ARM生态發展迅速,但目前國内市占僅有7%。飛騰則基于PKS體系,在信創領域有較好的市場表現。飛騰CPU(Phytium)和麒麟作業系統(Kylin) 和S-Security”的立體防護安全鍊,在安全性上有更明顯的優勢,進而在對資訊安全要求更高的領域,獲得了一席之地。

相比RISC-V,ARM經過二三十年時間的積累,已經形成了比較完善的生态,尤其是在基礎軟體方面,包括作業系統、基礎庫、程式設計語言與編譯器、開發環境和運作環境等等,對CPU架構有個支撐。無論鲲鵬依托華為生态還是飛騰PKS體系強調的安全性,本質上還都是ARM處理器在特定領域發展自身生态,以切入一個特定市場。

五、總結

從生态長遠來看,一方面,ARM伺服器跟資料中心主流x86生态互相不相容,如果使用者需要從x86平台切換到ARM平台,遷移工作量大;并且因為各行各業部署環境不相同,軟體問題很難從伺服器廠商獲得幫助。另一方面,開源為産業入局開啟一扇窗,但同時,對企業創新及差異化優勢又築起了一道牆,ARM版本的開源軟體在商用之前往往需進行功能完善、性能調優,工作量及難度大。在應用場景上,鲲鵬系和飛騰系都是基于既有生态和行業在伺服器領域優勢,逐漸向資料中心、存量x86市場邁進,但ARM在應用性能、生态、技術演進等方面的不足需要時間逐漸完善。在技術上,鲲鵬和飛騰均獲得ARM v8指令集授權研發設計CPU産品,但ARM指令集演進問題一直被诟病。對于國内信創産業,ARM架構在延續性和自主性的問題有亟待解決的問題。

繼續閱讀