天天看點

晶片異構:競争格局撲朔迷離

晶片異構:競争格局撲朔迷離

3月22日,英偉達釋出了一款資料中心專屬CPU——“Grace CPU超級晶片”。該晶片由兩顆CPU晶片組成,其間通過NVLink-C2C技術進行互連。而NVLink-C2C則與近日英特爾與台積電、三星等多家科技廠商發起的UCIe标準有着異曲同工之妙,也是一種新型的高速、低延遲、晶片到晶片的互連技術,可支援定制裸片與GPU、CPU、DPU、NIC、SOC實作互連。

目前,新型資料中對算力需求日漸持續攀升,僅靠單一類型的架構和處理器無法處理更複雜的海量資料,“異構”正在成為解決算力瓶頸關鍵技術方向。chiplet(“芯粒”)技術被視為“異構”技術的集納。3月初,英特爾發起的UCIe 标準将為chiplet(“芯粒”)技術提供統一接口和技術标準,台積電、三星、日月光、AMD、等廠商加入,但英偉達卻按兵不動。

專家指出,這表明英偉達并沒有想要遊離在UCIe聯盟之外,但也同時展現出了英偉達對NVLink-C2C的絕對信心,未來也許會組建自己的聯盟。在全球異構計算領域,雖然AMD也占有一席,但從其加入了UCIe 标準聯盟來看,AMD在“異構”上已經偏向英特爾這邊,未來異構晶片之戰主要在英特爾和英偉達之間進行,業界稱之為“雙英之戰”。

英特爾的“芯粒聯盟”

UCIe的魅力在于可以将各個企業的Chiplet規定在統一的标準之下,這樣不同廠商、工藝、架構、功能的晶片就可以進行混搭,進而輕而易舉地達到互通,并且還能實作高帶寬、低延遲、低能耗、低成本。芯謀研究進階分析師張彬磊向《中國電子報》記者表示,“小晶片”chiplet技術的發展有望推動異構計算的發展,chiplet技術提供統一接口和技術标準,解決異質封裝的連接配接和傳輸效率問題(速率、能效上會有小幅損失)。UCIe标準将促進chiplet相關技術的發展,有望在性能和功耗方面達到平衡和商業化價值。

晶片異構:競争格局撲朔迷離

英特爾曾提出六大技術支柱,對XPU的實作起到了關鍵作用,包括制程、架構、記憶體、互連、安全和軟體。異構計算雖然看似一個硬體層級的内容,但要釋放其能力,需要晶片、系統、軟體三層一體化考慮,才能夠發揮作用。一是晶片層,指在晶片封裝内的異構,和“小晶片”概念緊密相聯;二是系統層,指多功能多架構的計算架構進行整合;三是軟體層,統一的跨架構程式設計模型oneAPI,可以通過一套軟體接口、一套功能庫為開發者提供在不同架構上程式設計的便利性。在統一的UCIe标準下,異構的難度就會直線下降,并且效果更好。

目前,UCIe聯盟已經囊括了半導體、封裝、IP供應商、晶圓代工廠和雲端服務提供廠商等上下遊全産業鍊。AMD執行副總裁兼首席技術官Mark Papermaster表示:“UCIe标準将成為利用異構計算引擎和加速器來推動系統創新的關鍵因素。”

台積電科技院士、設計暨技術平台副總經理魯立忠說:“該全行業聯盟立志擴大封裝級內建生态系統,台積電很高興能加入其中。台積電提供各種矽技術和封裝技術,為異構UCIe器件打造多種實作方案。”

日月光半導體工程與技術營銷總監Lihong Cao博士指出:“業界普遍認為,異構內建有助于将基于小晶片的設計推向市場。”

英偉達或“另起爐竈”

然而,人們在關注UCIe聯盟之餘也發現,在UCIe聯盟當中并沒有英偉達與蘋果這兩大異構內建公司的身影。其中的原因,可以從英偉達CEO黃仁勳在近日召開的GTC 2022春季開發者大會上探知部分。

英偉達釋出了NVIDIANVLink-C2C互連技術,其鍊路的能效最多可比NVIDIA晶片上的PCIe Gen 5高出25倍,面積效率高出90倍,可實作每秒900GB乃至更高的一緻互聯帶寬。也就是說,在異構內建的小晶片互連方面,英偉達也在做與英特爾類似的事情。

“除NVLink-C2C外,英偉達将支援UCIe标準。與NVIDIA晶片的定制晶片內建既可以使用UCIe标準,也可以使用 NVLink-C2C。” 黃仁勳說。

對此有專家指出,這表明英偉達并沒有想要遊離在UCIe聯盟之外,但也同時展現出了英偉達對NVLink-C2C的絕對信心,未來也許會組建自己的聯盟。

賽迪顧問內建電路中心進階咨詢顧問池憲念向《中國電子報》記者表示,英偉達自身擁有的NVIDIA NVLink-C2C 依托于 NVIDIA 世界一流的 SERDES 和 LINK 設計技術,可從 PCB 級內建和多晶片模組擴充到矽插入器和晶圓級連接配接。這可提供極高的帶寬,同時優化能效和裸片面積效率。相較于UCIe标準,NVLink-C2C經過優化,延遲更低、帶寬更高、能效更高。

蘋果或許與英偉達有着同樣的考慮。本月初,“跨界選手”蘋果攜地球最強桌面晶片M1 Ultra搶别人“飯碗”,産品性能超越一衆CPU與GPU的專業選手。

芯謀研究分析師張先揚向記者表示,2022年3月9日蘋果公布的自研晶片M1 Ultra是基于Chiplet工藝,該技術提供了2.5TB/s的超高帶寬,遠遠領先于目前公布的UCIe1.0标準。也就是說,蘋果的Chiplet産品路線通過與台積電的合作就可以完成,且領跑于目前UCIe标準,是以對蘋果來說,加入該聯盟不是必選項。

“異構”格局撲朔迷離

此前,全球異構計算領域一直維持在互相制衡的三國殺格局。但UCIe聯盟的出現打破了原有的平衡,英特爾和AMD的親密互動,英偉達的似離非離,讓整個形勢變得撲朔迷離。盡管合縱連橫是上上之策,但打鐵還需自身硬,想要在異構計算的壁壘中率先突圍,實力才是硬道理,是以三巨頭都在各自擅長的領域内大動幹戈。

晶片異構:競争格局撲朔迷離

“三巨頭”分别都有自己主導的異構計算體系。池憲念介紹道,英特爾主導的異構計算體系主要為其自身系列産品和服務使用,在PC與高性能移動計算領域具有優勢;以IBM、谷歌、英偉達為主的OpenPower聯盟則以IBM Power晶片架構技術為基礎,主要面向高性能計算領域應用;以AMD、高通、ARM、三星、北京華夏芯等為主體的HSA(heterogeneous system architecture,異構計算系統)聯盟,是完全開放的異構計算聯盟,ARM、高通、三星等巨頭參與其中,在高性能移動計算領域具有優勢。

CPU龍頭英特爾作為業界唯一擁有CPU、獨立GPU、IPU、ASIC、FPGA、各種加速器的企業。在最近的投資者會議中提出了一個新架構-Falcon Shores,計劃于2024年完成,這是一款将X86和Xe GPU 整合到一個Xeon插槽中的新架構。

英特爾中國研究院院長宋繼強向《中國電子報》記者表示,将X86的主晶片加上GPU的性能整合在一起,這是一個創新。在性能上,Falcon Shores将提供超過5倍的每瓦性能、超過5倍的計算密度以及超過5倍的記憶體容量和帶寬。

在記者問到英特爾與其他幾家相比有哪些優勢時,宋繼強指出,一是技術基礎穩固且強大;二是英特爾能有架構和多種不同加速器去處理合适的應用負載;三是英特爾提出了“軟體優先”。這對開發者來說尤為重要。

GPU龍頭英偉達在去年的GTC2021上公布了其專為人工智能和超算使用需求打造的Grace CPU系列産品,并且打造了全新的晶片路線“GPU+DPU+CPU”。而在今年的GTC2022上,英偉達宣布推出首款面向AI基礎設施和高性能計算的基于Arm Neoverse的資料中心專屬CPU-“Grace CPU 超級晶片”。

GraceCPU 超級晶片是專為AI、HPC、雲計算和超大規模應用而設計,由兩個CPU晶片組成,兩者通過NVLink-C2C進行互連。并且能夠在單個插座(socket)中容納 144 個 Arm核心,在 SPECrate 2017_int_base 基準測試中的模拟性能達到業界領先的 740 分。根據 NVIDIA 實驗室使用同類編譯器估算,這一結果較目前的DGX A100要高1.5倍以上。

黃仁勳對其偏愛有加,贊揚道:“Garce的一切都令人驚歎,我們預計Grace超級晶片屆時将是最強大的CPU,是尚未釋出的第5代頂級CPU的2到3倍。”

對于英偉達來說,Grace CPU的出現使英偉達的CPU産品不再受英特爾和AMD的限制,英偉達雖然是全球GPU霸主,但GPU隻負責運算加速,需要依靠CPU下達指令才能執行,是以GPU和CPU的溝通就顯得格外重要。

盡管此前鬧得沸沸揚揚的ARM收購案雖然以失敗告終,但這也是英偉達向外界傳遞的信号,對于增強自身在異構方面的決心展露無遺。

新晉FPGA龍頭AMD在合并賽靈思完成後,擺脫各個行業隻能第二的處境,AMD就此成為繼英特爾後又一家兼具CPU、GPU、FPGA三大産品線的半導體廠商,未來AMD的CPU将與賽靈思的FPGA結合為CPU+FPGA的異構模式。賽靈思深耕的FPGA産品,2020年在FPGA市場,賽靈思全球和中國境内市場佔有率均達到50%~55%。對于賽靈思的收購,AMD總裁兼首席執行官蘇姿豐表示,AMD通過有效整合賽靈思在FPGA方面的優勢,能夠提供具有更廣泛高性能的計算産品組合,提供從CPU到GPU、ASIC、FPGA系統級解決方案。同時,借助賽靈思在5G、通信、自動駕駛和行業領域的資源,AMD能夠将高性能計算能力帶入更多領域,擴充到更廣泛的客戶群體中。而且AMD未來可實作FPGA在現成CPU 上運作程式設計語言,并研發出用于實作某些功能或軟體堆棧的定制ASIC産品。

AMD全球進階副總裁、大中華區總裁潘曉明曾在2021世界半導體大會上表示:“今天和未來的工作負載需要強大的計算能力,異構計算是關鍵的未來趨勢。AMD未來在計算、圖形和解決方案的三個方面聚焦高性能計算,在持續發展的行業中保持高性能計算上司力。”

繼續閱讀