天天看點

NVIDIA推出DGX H100系統 領跑企業級AI基礎設施

NVIDIA今日宣布推出第四代NVIDIA DGX系統,這是全球首個基于全新NVIDIA H100 Tensor Core GPU的AI平台。

NVIDIA推出DGX H100系統 領跑企業級AI基礎設施

NVIDIA DGX H100 Systems

DGX H100系統能夠滿足大型語言模型、推薦系統、醫療健康研究和氣候科學的大規模計算需求。每個DGX H100系統配備八塊NVIDIA H100 GPU,并由 NVIDIA NVLink連接配接,能夠在新的FP8精度下達到32 Petaflop的AI性能,比上一代系統性能高6倍。

DGX H100系統是新一代NVIDIA DGX POD和NVIDIA DGX SuperPOD AI基礎設施平台的構模組化塊。新的DGX SuperPOD架構采用了一個全新的NVIDIA NVLink Switch系統,通過這一系統最多可連接配接32個節點,總計256塊H100 GPU。

新一代DGX SuperPOD提供1 Exaflops的FP8 AI性能,比上一代産品性能高6倍,能夠運作具有數萬億參數的龐大LLM工作負載,進而推動AI的前沿發展。

NVIDIA創始人兼首席執行官黃仁勳表示:“AI已經從根本上改變了軟體的功能和産出方式。利用AI來革新自身所處行業的公司也意識到了自身AI基礎設施的重要性。NVIDIA全新DGX H100系統将賦能企業AI工廠,助力其從資料中提煉出我們最具價值的資源,即‘智能’。"

全球運作速度最快的AI超級計算機——NVIDIA Eos

NVIDIA将率先使用突破性的新型AI架構來建構DGX SuperPOD,賦能NVIDIA研究人員的研究工作,推動氣候科學、數字生物學和AI未來的發展。

“Eos”超級計算機将于今年晚些時候開始運作,共配備576台DGX H100系統,共計 4608塊DGX H100 GPU,有望成為全球運作速度最快的AI系統。

NVIDIA Eos預計将提供18.4 Exaflops的AI計算性能,比日本的Fugaku超級計算機快4倍,後者是目前運作速度最快的系統。在傳統的科學計算方面,Eos預計将提供275 Petaflop 的性能。

對于NVIDIA及其OEM和雲計算合作夥伴,Eos将成為其先進AI基礎設施的藍圖。

借助DGX H100系統、DGX POD和DGX SuperPOD,輕松擴充企業級AI

在企業從初始項目發展到廣泛部署的過程中,DGX H100系統能夠實作輕松擴充,滿足企業的AI需求。

除了八塊H100 GPU以及總計6400億個半導體之外,每個DGX H100系統還包含兩個NVIDIA BlueField-3 DPU,以用于解除安裝、加速和隔離進階網絡、存儲及安全服務。

八個NVIDIA ConnectX-7 Quantum-2 InfiniBand網卡能夠提供400 GB/s的吞吐量,可用于連接配接計算和存儲,這一速度比上一代系統提升了一倍。第四代NVLink與NVSwitch相結合,能夠在每個DGX H100系統中的各個GPU之間實作900 GB/s的連接配接速度,是上一代系統的1.5倍。

DGX H100系統使用雙x86 CPU,能夠與NVIDIA網絡和NVIDIA合作夥伴提供的儲存設備相結合,使DGX POD能夠靈活用于各種規模的AI計算。

借助 DGX H100 系統,DGX SuperPOD可成為具有可擴充性的卓越的企業級AI中心。DGX SuperPOD中的DGX H100節點和H100 GPU由NVLink Switch系統和NVIDIA Quantum-2 InfiniBand連接配接,帶寬速度可達70 TB/s,比上一代産品高11倍。NVIDIA合作夥伴提供的儲存設備将經過測試和認證,以滿足DGX SuperPOD AI計算的需求。

多個DGX SuperPOD單元可組合使用,為汽車、醫療健康、制造、通信、零售等行業提供開發大型模型所需的AI性能。

NVIDIA DGX Foundry托管的開發解決方案正在全球擴充,使DGX SuperPOD客戶能夠在他們的系統安裝期間,立即擷取先進的計算基礎設施。北美、歐洲和亞洲的新增地點支援遠端通路DGX SuperPOD(或其中部分)。

DGX Foundry中包含NVIDIA Base Command軟體,後者能夠使客戶基于DGX SuperPOD基礎設施,輕松管理端到端AI開發生命周期。

通過在全球各地的Equinix IBX(International Business Exchange)資料中心托管的NVIDIA LaunchPad實驗室,符合資格的企業可以免費體驗NVIDIA Base Command和DGX系統。

企業級AI軟體MLOps助力客戶提高AI采用率

為支援正在進行AI開發的DGX客戶,NVIDIA DGX-Ready軟體合作夥伴(包括Domino Data Lab、Run:ai和Weights&Biases等)提供的MLOps解決方案将加入“NVIDIA AI加速”計劃。

參與活動的合作夥伴提供的MLOps應用程式将經過驗證,為DGX客戶提供企業級工作流以及叢集管理、排程與編排解決方案。

此外,NVIDIA DGX系統現在包含NVIDIA AI Enterprise軟體套件,該套件新增了對裸金屬基礎設施的支援。DGX客戶可使用軟體套件中包含的預訓練NVIDIA AI平台模型、工具包和架構(例如NVIDIA RAPIDS、NVIDIA TAO工具套件、NVIDIA Triton推理伺服器等)來加快工作速度。

DGX-Ready托管服務計劃能夠簡化AI部署

随着企業AI采用率不斷提高,客戶正在尋求更多選擇,以便添加實作業務轉型所需的基礎設施。NVIDIA推出新的DGX-Ready托管服務計劃,能夠為希望與服務提供商開展合作來監督其基礎設施的客戶提供支援。

德勤是率先與NVIDIA合作開展此計劃的全球提供商,并将經過認證,可與區域供應商(CGit、ePlus、Insight Enterprises和PTC System)一起,為歐洲、北美和亞洲的客戶提供支援。

德勤咨詢首席合夥人兼AI與資料營運服務負責人Jim Rowan表示:“隻有企業能夠将技術內建到營運中時,AI才可能助推業務實作突破。借助新的DGX-Ready托管服務計劃,客戶可以輕松采用先進的AI技術以及由德勤全球專家管理的NVIDIA DGX系統和軟體。”

DGX-Ready生命周期管理計劃助力實作輕松更新

現在,客戶可以通過新的DGX-Ready生命周期管理計劃,借助新的NVIDIA DGX平台更新其現有DGX系統。

參加DGX-Ready生命周期管理計劃的NVIDIA管道合作夥伴将可以更新上一代DGX系統,以供新客戶進行購買,并擴充用于AI基礎設施的全球通用系統的擷取途徑。

供貨資訊

從第三季度起,NVIDIA的全球合作夥伴将開始供應NVIDIA DGX H100系統、DGX POD 和DGX SuperPOD。

客戶還可以選擇在由Cyxtera、Digital Realty和Equinix IBX資料中心等NVIDIA DGX-Ready資料中心合作夥伴營運的托管設施中部署DGX系統。

(7891529)

繼續閱讀