天天看點

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

作者:驅動之家

2022年3月的GTC技術大會上,NVIDIA正式釋出了首款資料中心CPU——Grace,同時打造了兩顆超級晶片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一。

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

Grace CPU二合一

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

Grace CPU+Hopper GPU二合一

現在,NVIDIA官方詳細揭示了Grace Superchip超級晶片的設計與性能、能效。

它通過NVLink-C2C晶片間互連總線,将兩顆Grace CPU整合在一塊基闆上,彼此之間的雙向帶寬多達900GB/s。

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

Grace CPU基于Armv9-A 9.0架構、Neoverse V2 64位核心,以4個128-bit功能單元的方式配置了兩組SIMD矢量指令集,一是SVE 2(縮放矢量擴充第二版),二是NEON(進階SIMD)。

它還支援LSE(大型系統擴充),可提供低成本的原子操作,改進CPU通信吞吐。

NVIDIA聲稱,這種核心的能效,是如今伺服器常見x86核心的2倍。

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心
NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

Grace CPU單顆內建72個核心,互相通過3.2TB/s超高帶寬的NVIDIA縮放一緻性Fabric總線互連,而二合一的超級晶片上就是144個核心。

每核心64KB一級指令緩存、64KB一級資料緩存、1MB二級緩存,一顆超級晶片的所有核心共享234MB三級緩存。

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

記憶體整合封裝了LPDDR5X,最大容量960GB,最高帶寬1TB/s(每一顆500GB/s),還支援ECC。

對比傳統的八通道DDR5,這種設計不但帶寬高出53%,機關功耗也隻有1/8。

對比海量帶寬的HBM2e,機關成本隻有1/3,容量則可達8倍。

擴充支援八組PCIe 5.0 x16,總帶寬1TB/s,還有用于管理的低速PCIe通道。

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心

性能方面,一顆超級晶片的FP64雙精度峰值浮點性能可達7.1TFlops(每秒7.1萬億次計算),熱設計功耗500W。

NVIDIA對比了AMD Zen3架構的霄龍7763 64核心,雙路組成128核心,号稱性能可領先1.5-2.5倍,能效可領先2.0-3.5倍!

當然,AMD已經有了Zen4架構、最多96核心的霄龍9004系列,NVIDIA Grace依然還沒有商用。

NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心
NVIDIA 144核心超級CPU揭秘:3.5倍能效碾壓AMD 128核心