天天看點

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

11月10日消息,英特爾今天正式推出了全球首款配備 HBM 記憶體的 x86 CPU——Intel Xeon Max 系列CPU,其基于代号Sapphire Rapids-HBM晶片建構。同時,英特爾還推出了基于Ponte Vecchio建構的全新MAX系列GPU。英特爾表示,新産品将為美國能源部阿貢國家實驗室的Aurora超級計算機提供動力。

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

Xeon MAX CPU

新Xeon MAX CPU中的 56 個核心均為 P 核,可提供 112 個線程和 350W TDP。它采用基于 EMIB 的設計,分為四個叢集。但最有趣的是,它還具有 64 GB 的 HBM2e 記憶體,分為 4 個 16 GB 的叢集,總記憶體帶寬為 1 TB / s,每個核心的 HBM 都超過 1 GB。

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

英特爾還表示,HBM 記憶體的內建不需要更改代碼,并且應該對使用者實作無縫透明。

英特爾公司副總裁兼超級計算集團總經理 jeff McVeigh表示:“為了確定沒有 HPC 工作負載掉隊,我們需要一個能夠将帶寬、計算、生産力最大化并最終可使得影響最大化的解決方案。英特爾 Max 系列産品系列為更廣闊的市場帶來了高帶寬記憶體,以及一個 API,使 CPU 和 GPU 之間的代碼共享更容易,并更有效地解決世界上最大的挑戰。

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

據介紹,這 56 個核心由四個 Die 構成,并使用英特爾的多晶片互連橋 (EMIB) 進行連接配接,其中封裝了 64GB HBM 記憶體,該平台将采用 PCIe 5.0 和 CXL 1.1 I / O 接口。

  • 在 HCPG 性能相同的情況下,功耗比 AMD Milan-X 叢集低 68%。
  • AMX 擴充可提高 AI 性能,并為 INT8 和 INT32 累積操作提供比 AVX-512 高 8 倍的峰值吞吐量。
  • 提供在不同 HBM 和 DDR 記憶體配置中運作的靈活性。

工作負載基準:

  • 氣候模組化:僅使用 HBM 在 MPAS-A 上比 AMD Milan-X 快 2.4 倍。
  • 分子動力學:在 DeePMD 上,與具有 DDR5 記憶體的競争産品相比,性能提高了 2.8 倍。
首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

在性能方面,英特爾稱,Xeon Max配備的高帶寬記憶體足以滿足最常見的HPC工作負載,與舊的英特爾至強 8380 系列處理器或 AMD EPYC 7773X 相比,可在某些工作負載中提供接近 5 倍的性能。

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU
首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

新 CPU 中還包含 20 個加速引擎,主要是用于 AVX-512、AMX、DSA 和英特爾 DL Boost 工作負載。據稱,英特爾在 MLPerf DeepCAM 訓練中的性能比 AMD 7763 提升了 3.6 倍,比 NVIDIA 的 A100 提升了 1.2 倍。

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU
首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU
首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

MAX系列GPU

MAX系列GPU采用了Xe-HPC架構的計算晶片,是唯一具有原生光線追蹤加速功能的HPC/AI GPU,旨在加速科學可視化,是針對要求最苛刻的計算工作負載的新基礎架構。其擁有64MB的L1緩存和408MB的L2緩存(業界最高),提高了可吞吐量和性能。

根據英特爾過往的介紹,MAX系列GPU所采用的Ponte Vecchio晶片,是英特爾首個百億億次級計算GPU,使用了英特爾有史以來最先進的封裝技術,擁有超過1000億個半導體。其總共有63個子產品,包括了16個Xe-HPG架構的計算晶片、8個Rambo cache晶片、2個Xe基礎晶片、11個EMIB連接配接晶片、2個Xe Link I/O晶片和8個HBM晶片、以及16個負責TDP輸出的子產品,通過EMIB與Foveros 3D封裝中整合在一起。

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

MAX系列GPU提供了多種外形尺寸,以滿足不同客戶的需求,分别有:

  • MAX 1100 - 雙槽PCIe外形,56個Xe核心和48GB的HBM2e顯存,克通過英特爾Xe Link橋接器實作多卡連接配接,TDP為300W。
  • MAX 1350 - OAM子產品,112個Xe核心和96GB的HBM2e顯存,TDP為450W。
  • MAX 1550 - 英特爾性能最高的OAM子產品,128個Xe核心和128GB的HBM2e顯存,TDP為600W。

除了PCIe單卡和OAM子產品以外,英特爾還提供了x4 GPU OAM載闆和英特爾資料中心GPU Max系列子系統,以實作子系統内的高性能多GPU通信。

首次內建HBM記憶體,英特爾釋出Xeon Max CPU!還有全新Max系列GPU

據介紹,英特爾Xeon Max CPU 将在 Aurora 超級計算機中首次亮相,目前正在阿貢國家實驗室建造。Aurora 有望成為第一台超過 2 exaflops 峰值雙精度計算性能的超級計算機。

此外,Aurora 還将率先展示在單個系統中将 Max 系列 GPU 和 CPU 配對的強大功能,擁有超過 10000 個“刀片”,每個“刀片”包含六個 Max 系列 GPU 和兩個至強 Max CPU。

英特爾還推出了測試開發系統,由128個刀片式伺服器機架組成,為Aurora早期科學計劃的研究人員提供服務。英特爾表示,Aurora超算系統旨在處理高性能計算、AI/ML和大資料分析工作負載,可實作2 ExaFLOP的峰值計算能力,預計在2023年投入運作。

英特爾下一代Max系列GPU的代号為Rialto Bridge,計劃于2024年推出,具有更高的性能和無縫更新途徑。未來英特爾還會推出代号Falcon Shores的XPU,其包含兩種類型的計算單元,分别是CPU和GPU,将廣泛使用英特爾的多晶片/多子產品方法進行設計,根據目标應用的需求,靈活配比x86和Xe-HPC架構的核心數量。

編輯:芯智訊-林子 綜合自網絡