晶片異構：競争格局撲朔迷離

3月22日，英偉達釋出了一款資料中心專屬CPU——“Grace CPU超級晶片”。該晶片由兩顆CPU晶片組成，其間通過NVLink-C2C技術進行互連。而NVLink-C2C則與近日英特爾與台積電、三星等多家科技廠商發起的UCIe标準有着異曲同工之妙，也是一種新型的高速、低延遲、晶片到晶片的互連技術，可支援定制裸片與GPU、CPU、DPU、NIC、SOC實作互連。

目前，新型資料中對算力需求日漸持續攀升，僅靠單一類型的架構和處理器無法處理更複雜的海量資料，“異構”正在成為解決算力瓶頸關鍵技術方向。chiplet（“芯粒”）技術被視為“異構”技術的集納。3月初，英特爾發起的UCIe 标準将為chiplet（“芯粒”）技術提供統一接口和技術标準，台積電、三星、日月光、AMD、等廠商加入，但英偉達卻按兵不動。

專家指出，這表明英偉達并沒有想要遊離在UCIe聯盟之外，但也同時展現出了英偉達對NVLink-C2C的絕對信心，未來也許會組建自己的聯盟。在全球異構計算領域，雖然AMD也占有一席，但從其加入了UCIe 标準聯盟來看，AMD在“異構”上已經偏向英特爾這邊，未來異構晶片之戰主要在英特爾和英偉達之間進行，業界稱之為“雙英之戰”。

英特爾的“芯粒聯盟”

UCIe的魅力在于可以将各個企業的Chiplet規定在統一的标準之下，這樣不同廠商、工藝、架構、功能的晶片就可以進行混搭，進而輕而易舉地達到互通，并且還能實作高帶寬、低延遲、低能耗、低成本。芯謀研究進階分析師張彬磊向《中國電子報》記者表示，“小晶片”chiplet技術的發展有望推動異構計算的發展，chiplet技術提供統一接口和技術标準，解決異質封裝的連接配接和傳輸效率問題（速率、能效上會有小幅損失）。UCIe标準将促進chiplet相關技術的發展，有望在性能和功耗方面達到平衡和商業化價值。

英特爾曾提出六大技術支柱，對XPU的實作起到了關鍵作用，包括制程、架構、記憶體、互連、安全和軟體。異構計算雖然看似一個硬體層級的内容，但要釋放其能力，需要晶片、系統、軟體三層一體化考慮，才能夠發揮作用。一是晶片層，指在晶片封裝内的異構，和“小晶片”概念緊密相聯；二是系統層，指多功能多架構的計算架構進行整合；三是軟體層，統一的跨架構程式設計模型oneAPI，可以通過一套軟體接口、一套功能庫為開發者提供在不同架構上程式設計的便利性。在統一的UCIe标準下，異構的難度就會直線下降，并且效果更好。

目前，UCIe聯盟已經囊括了半導體、封裝、IP供應商、晶圓代工廠和雲端服務提供廠商等上下遊全産業鍊。AMD執行副總裁兼首席技術官Mark Papermaster表示：“UCIe标準将成為利用異構計算引擎和加速器來推動系統創新的關鍵因素。”

台積電科技院士、設計暨技術平台副總經理魯立忠說：“該全行業聯盟立志擴大封裝級內建生态系統，台積電很高興能加入其中。台積電提供各種矽技術和封裝技術，為異構UCIe器件打造多種實作方案。”

日月光半導體工程與技術營銷總監Lihong Cao博士指出：“業界普遍認為，異構內建有助于将基于小晶片的設計推向市場。”

英偉達或“另起爐竈”

然而，人們在關注UCIe聯盟之餘也發現，在UCIe聯盟當中并沒有英偉達與蘋果這兩大異構內建公司的身影。其中的原因，可以從英偉達CEO黃仁勳在近日召開的GTC 2022春季開發者大會上探知部分。

英偉達釋出了NVIDIANVLink-C2C互連技術，其鍊路的能效最多可比NVIDIA晶片上的PCIe Gen 5高出25倍，面積效率高出90倍，可實作每秒900GB乃至更高的一緻互聯帶寬。也就是說，在異構內建的小晶片互連方面，英偉達也在做與英特爾類似的事情。

“除NVLink-C2C外，英偉達将支援UCIe标準。與NVIDIA晶片的定制晶片內建既可以使用UCIe标準，也可以使用 NVLink-C2C。” 黃仁勳說。

對此有專家指出，這表明英偉達并沒有想要遊離在UCIe聯盟之外，但也同時展現出了英偉達對NVLink-C2C的絕對信心，未來也許會組建自己的聯盟。

賽迪顧問內建電路中心進階咨詢顧問池憲念向《中國電子報》記者表示，英偉達自身擁有的NVIDIA NVLink-C2C 依托于 NVIDIA 世界一流的 SERDES 和 LINK 設計技術，可從 PCB 級內建和多晶片模組擴充到矽插入器和晶圓級連接配接。這可提供極高的帶寬，同時優化能效和裸片面積效率。相較于UCIe标準，NVLink-C2C經過優化，延遲更低、帶寬更高、能效更高。

蘋果或許與英偉達有着同樣的考慮。本月初，“跨界選手”蘋果攜地球最強桌面晶片M1 Ultra搶别人“飯碗”，産品性能超越一衆CPU與GPU的專業選手。

芯謀研究分析師張先揚向記者表示，2022年3月9日蘋果公布的自研晶片M1 Ultra是基于Chiplet工藝，該技術提供了2.5TB/s的超高帶寬，遠遠領先于目前公布的UCIe1.0标準。也就是說，蘋果的Chiplet産品路線通過與台積電的合作就可以完成，且領跑于目前UCIe标準，是以對蘋果來說，加入該聯盟不是必選項。

“異構”格局撲朔迷離

此前，全球異構計算領域一直維持在互相制衡的三國殺格局。但UCIe聯盟的出現打破了原有的平衡，英特爾和AMD的親密互動，英偉達的似離非離，讓整個形勢變得撲朔迷離。盡管合縱連橫是上上之策，但打鐵還需自身硬，想要在異構計算的壁壘中率先突圍，實力才是硬道理，是以三巨頭都在各自擅長的領域内大動幹戈。

“三巨頭”分别都有自己主導的異構計算體系。池憲念介紹道，英特爾主導的異構計算體系主要為其自身系列産品和服務使用，在PC與高性能移動計算領域具有優勢；以IBM、谷歌、英偉達為主的OpenPower聯盟則以IBM Power晶片架構技術為基礎，主要面向高性能計算領域應用；以AMD、高通、ARM、三星、北京華夏芯等為主體的HSA(heterogeneous system architecture，異構計算系統)聯盟，是完全開放的異構計算聯盟，ARM、高通、三星等巨頭參與其中，在高性能移動計算領域具有優勢。

CPU龍頭英特爾作為業界唯一擁有CPU、獨立GPU、IPU、ASIC、FPGA、各種加速器的企業。在最近的投資者會議中提出了一個新架構-Falcon Shores，計劃于2024年完成，這是一款将X86和Xe GPU 整合到一個Xeon插槽中的新架構。

英特爾中國研究院院長宋繼強向《中國電子報》記者表示，将X86的主晶片加上GPU的性能整合在一起，這是一個創新。在性能上，Falcon Shores将提供超過5倍的每瓦性能、超過5倍的計算密度以及超過5倍的記憶體容量和帶寬。

在記者問到英特爾與其他幾家相比有哪些優勢時，宋繼強指出，一是技術基礎穩固且強大；二是英特爾能有架構和多種不同加速器去處理合适的應用負載；三是英特爾提出了“軟體優先”。這對開發者來說尤為重要。

GPU龍頭英偉達在去年的GTC2021上公布了其專為人工智能和超算使用需求打造的Grace CPU系列産品，并且打造了全新的晶片路線“GPU+DPU+CPU”。而在今年的GTC2022上，英偉達宣布推出首款面向AI基礎設施和高性能計算的基于Arm Neoverse的資料中心專屬CPU-“Grace CPU 超級晶片”。

GraceCPU 超級晶片是專為AI、HPC、雲計算和超大規模應用而設計，由兩個CPU晶片組成，兩者通過NVLink-C2C進行互連。并且能夠在單個插座（socket）中容納 144 個 Arm核心，在 SPECrate 2017_int_base 基準測試中的模拟性能達到業界領先的 740 分。根據 NVIDIA 實驗室使用同類編譯器估算，這一結果較目前的DGX A100要高1.5倍以上。

黃仁勳對其偏愛有加，贊揚道：“Garce的一切都令人驚歎，我們預計Grace超級晶片屆時将是最強大的CPU，是尚未釋出的第5代頂級CPU的2到3倍。”

對于英偉達來說，Grace CPU的出現使英偉達的CPU産品不再受英特爾和AMD的限制，英偉達雖然是全球GPU霸主，但GPU隻負責運算加速，需要依靠CPU下達指令才能執行，是以GPU和CPU的溝通就顯得格外重要。

盡管此前鬧得沸沸揚揚的ARM收購案雖然以失敗告終，但這也是英偉達向外界傳遞的信号，對于增強自身在異構方面的決心展露無遺。

新晉FPGA龍頭AMD在合并賽靈思完成後，擺脫各個行業隻能第二的處境，AMD就此成為繼英特爾後又一家兼具CPU、GPU、FPGA三大産品線的半導體廠商，未來AMD的CPU将與賽靈思的FPGA結合為CPU+FPGA的異構模式。賽靈思深耕的FPGA産品，2020年在FPGA市場，賽靈思全球和中國境内市場佔有率均達到50%~55%。對于賽靈思的收購，AMD總裁兼首席執行官蘇姿豐表示，AMD通過有效整合賽靈思在FPGA方面的優勢，能夠提供具有更廣泛高性能的計算産品組合，提供從CPU到GPU、ASIC、FPGA系統級解決方案。同時，借助賽靈思在5G、通信、自動駕駛和行業領域的資源，AMD能夠将高性能計算能力帶入更多領域，擴充到更廣泛的客戶群體中。而且AMD未來可實作FPGA在現成CPU 上運作程式設計語言，并研發出用于實作某些功能或軟體堆棧的定制ASIC産品。

AMD全球進階副總裁、大中華區總裁潘曉明曾在2021世界半導體大會上表示：“今天和未來的工作負載需要強大的計算能力，異構計算是關鍵的未來趨勢。AMD未來在計算、圖形和解決方案的三個方面聚焦高性能計算，在持續發展的行業中保持高性能計算上司力。”

晶片異構：競争格局撲朔迷離

繼續閱讀

【幸福鄰裡】朔方路社群：社群物業“交叉任職、雙向進入”共同推進社群治理

剛離婚前妻病逝，我幸災樂禍參加葬禮，進屋後，我發誓這輩子不娶

華為放大招，又一麒麟 9 系晶片曝光

191億，中國移動AI伺服器采購落地，華為昇騰晶片成最大赢家

硬核對抗華為，小米自研玄戒晶片要來了！澎湃Vs鴻蒙，玄戒Vs麒麟

馬斯克腦機接口公司第二位受試者獲FDA準許今年計劃為10人植入晶片

高像素、AI算法、自研晶片……國産手機影像之争日趨白熱化 | 業界

英偉達下調供應中國市場的H20 AI晶片價

中國市場遇冷，傳英偉達已下調H20晶片價格

比晶片更難，被美日全壟斷，中國企業連山寨版都造不出嗎？

華為手機銷量暴漲，高通晶片卻要漲價，網曝骁龍8Gen4将上漲500元

高達3440億元！國家晶片大基金三期落地，史上最大手筆、六大銀行持股｜矽基世界

3440億力挺晶片企業，國家大基金三期落地！史上最大手筆，六大銀行持股

剛剛，中國晶片史上最大基金誕生了

麒麟9000c晶片悄然登場，華為加入Arm PC競賽

nova13系列曝光：換上頂配麒麟晶片