天天看點

市值暴漲至萬億美元後,英偉達再放大招!推出超級 AI 計算平台

作者:InfoQ

作者 | 李冬梅

美國企業對 H100 處理器的旺盛需求,推動英偉達市值飙升至 1 萬億美元。

上周,英偉達股價一周内上漲了 25%,市值直逼萬億美元,其創始人黃仁勳的身價也突破了 330 億美元。

春風得意的黃老闆于 5 月 29 日現身在中國台北舉辦的 COMPUTEX 大會,并在大會上釋出了面向所有行業的生成式AI平台。“我們正在重新發明計算機,加速計算和人工智能标志着計算正在被重新定義。”黃仁勳表示。

黃仁勳正在帶領英偉達從一家晶片公司轉向提供AI計算系統的公司,他此前稱,人工智能的 iPhone 時刻已經來臨。

英偉達釋出超級晶片 GH200 和 AI 計算平台

受 AI 熱潮的推動,英偉達也在硬體領域緊跟技術潮流,釋出了一系列産品和解決方案:推出大記憶體生成式AI超級計算機 DGX GH200,可加速生成式 AI 設計的 Grace Hopper 超級晶片 GH200 已全面投産;推出全新加速以太網平台 Spectrum-X,為遊戲提供定制化 AI 模型代工服務;與全球最大的營銷服務機構 WPP 合作打造生成式 AI 内容引擎,多家世界頂級電子制造商采用英偉達生成式 AI 工具與 Omniverse 平台建構先進的數字工廠。

據悉,NVIDIA® GH200 Grace Hopper 超級晶片将為全球各地即将上線的系統提供運作複雜 AI 和 HPC 工作負載所需的動力。在 COMPUTEX 上,黃仁勳公布了關于 GH200 Grace Hopper 超級晶片的更多細節。

NVIDIA® GH200 Grace Hopper 超級晶片使用 NVIDIA NVLink®-C2C 互連技術,将基于 Arm 的 NVIDIA Grace CPU 和 Hopper GPU 架構互聯,實作了高達 900GB/s 的總帶寬,比傳統加速系統中的标準 PCIe Gen5 通道高出 7 倍,算力有了很大程度的提高,并且能夠滿足要求最苛刻的生成式 AI 和 HPC 應用。

具體來說, GH200 超級晶片是将 72 核的 Grace CPU、H100 GPU、96GB 的 HBM3 和 512 GB 的 LPDDR5X 內建在同一個封裝中,擁有高達 2000 億個半導體。這種組合提供了 CPU 和 GPU 之間驚人的資料帶寬,高達 900 GB/s,為某些記憶體受限的工作負載提供了巨大的優勢。

值得一提的,英偉達正式釋出了一款新型大記憶體 AI 超級計算機——由 NVIDIA GH200 Grace Hopper 超級晶片和 NVIDIA NVLink Switch System 驅動的 NVIDIA DGX 超級計算機,旨在助力開發面向生成式 AI 語言應用、推薦系統和資料分析工作負載的巨型、下一代模型。

DGX GH200 的細節還不太清楚,但已确認英偉達使用了一種新的 NVLink Switch 系統,包含 36 個 NVLink 開關,将 256 個 GH200 Grace Hopper 晶片和 144TB 的共享記憶體連接配接成一個單元,英偉達 CEO 黃仁勳表示,GH200 晶片為“巨型 GPU”。英偉達表示,256 顆 Grace Hopper 超級晶片将 DGX GH200 的“AI 性能”提升到了 exaflop(一百萬萬億次)。

NVIDIA 加速計算副總裁 Ian Buck 表示:“生成式AI正在迅速帶來業務變革,解鎖醫療、金融、商業服務等行業的新機遇并加速這些行業的研發工作。随着 Grace Hopper 超級晶片的全面投産,全球的制造商很快将會提供企業使用專有資料建構和部署生成式 AI 應用所需的加速基礎設施。”

ChatGPT 問世後,晶片行業變天了

2022 年,英偉達釋出了 H100——這是其有史以來最強大、也最昂貴的處理器之一,機關價格約為 4 萬美元。當時看來,這款産品的釋出時機并不理想,企業客戶紛紛在巨大的通脹壓力下削減開支。

但就在 11 月,ChatGPT橫空出世後,情況發生了變化。

英偉達首席執行官黃仁勳表示,“剛剛經曆艱難的一年,情況似乎一夜之間就出現了轉機。”OpenAI 打造的這款熱門聊天機器人堪稱“尤裡卡時刻”(或頓悟時刻),“立即創造出巨大需求”。

ChatGPT 的迅速蹿紅在全球領先的科技巨頭和初創公司之間掀起一波軍備競賽,各方開始競相争奪寶貴的 H100 資源。黃仁勳稱這款産品是“全球首個為生成式 AI 專門設計的計算機晶片”,能夠幫助 AI 系統更快輸出順暢自然的文本、圖像和内容。

就在過去一周,在正确的時間推出正确的産品再次成為決勝的關鍵。英偉達上周三宣布,其截至 7 月的本季度銷售額預計将達 110 億美元,較華爾街之前的估計高出 50%以上。這波強勁浪潮背後,無疑是衆多大型科技公司恢複資料中心支出和瘋狂采購 AI 晶片的現實需求。

投資人對此番預測也給出了積極回應,僅上周四一天之内就讓英偉達公司的市值增加了 1840 億美元。于是這家已經是全球最有價值的晶片公司在估值方面開始逼近萬億大關。

市值暴漲至萬億美元後,英偉達再放大招!推出超級 AI 計算平台

這項技術有望重塑各行各業,帶來巨大的生産力提升并取代數百萬個工作崗位。

而 H100 晶片将加快這一技術飛躍。H100 基于名為“Hopper”的英偉達全新晶片架構,以美國程式設計先驅 Grace Hopper 的名字命名,如今已經是整個矽谷最炙手可熱的稀缺資源。

黃仁勳表示,“就在我們着手将 Hopper 投入量産之際,AI 突破到來了。”也就是說,Hopper 剛好是在 ChatGPT 正式亮相的幾周之前開始大規模生産。

黃仁勳對于持續收益的信心,很大程度來自與晶片制造巨頭台積電的密切合作。雙方計劃擴大 H100 的生産規模,以滿足微軟、亞馬遜和谷歌等雲服務商,Meta 等網際網路大廠以及其他企業客戶的爆發式需求。

CoreWeave 是一家專注 AI 的雲基礎設施初創公司。作為首批收到 H100 的客戶之一,公司首席戰略官 Brannin McBee 表示“這已經成為地球上最稀缺的工程資源之一”。

也有部分客戶要等待半年之久,才能拿到自己用來訓練大規模資料模型的 H100 晶片供應。更多 AI 初創公司則紛紛表示擔心,稱在需求起飛那一刻,H100 就将面臨供不應求。

英偉達成為了 AI 浪潮中的首批赢家

馬斯克也已經為自己的 AI 初創公司 X.ai 買下大量英偉達晶片,他本人也在本周《華爾街日報》的活動中表示,目前 GPU“比藥品更難獲得”,還開玩笑說“而且這種情況在舊金山随處可見”。

“計算成本已經飙升至天文數字,最低的準入門檻也是投入 2.5 億美元為生成式 AI 系統建構伺服器硬體。”

事實證明,H100 特别受到微軟和亞馬遜等大型科技企業的歡迎。他們正紛紛建立以 AI 工作負載為中心的更多資料中心。此外,OpenAI、Anthropic、Stability AI 和 Inflection AI 等 AI 初創公司也在密切關注 H100 的性能承諾,希望借助它的力量加快産品釋出、降低訓練成本。

英偉達超大規模與高性能計算業務負責人 Ian Buck 表示,“從購買難度來講,沒錯,新架構 GPU 就是不容易買到。”肩負增加 H100 以滿足需求這項艱巨任務的 Buck 承認,“目前供不應求已經成為規模性事件”,部分大客戶正瘋狂采購數以萬計的 GPU。

這種性能極強的晶片負責充當資料中心的“加速器”,其搭載的 800 億個半導體達到最新款 iPhone 處理器半導體數的 5 倍。盡管 H100 的售價高達 2020 年發售的上代 A100 晶片的 2 倍,但早期買家紛紛表示其性能至少提高了 3 倍,是以仍然極具成本效益。

作為 Stable Diffusion 圖像生成服務背後的廠商,Stability AI 聯合創始人兼 CEO Emad Mostaque 表示“H100 解決了長期困擾 AI 模型建立者的可擴充性問題”。“這非常重要,它能讓我們更快訓練出更大的模型,真正将研究問題轉化為工程問題。”

雖然 H100 的釋出可謂正當其時,但英偉達在 AI 領域的突破實際源自近 20 年前的軟體創新。

英偉達的 Cuda 軟體誕生于 2006 年,作用就是讓 GPU 在圖形之外作為其他工作負載類型的加速器。待時間來到 2012 年左右,“AI 終于找上了我們。”

加拿大的研究人員們很快意識到 GPU 非常适合用于建立神經網絡,這是一種由人腦内神經元間互相作用啟發而來的 AI 形式,後來成為 AI 開發的新焦點。Buck 感慨道,“我們花了近 20 年才最終走到了今天。”

英偉達如今擁有的軟體工程師比硬體工程師還多,這也使其得以支援後續幾年出現的多種不同類型的 AI 架構,也使其晶片在訓練 AI 模型所需要的統計計算方面愈發高效。

Hopper 是首個針對 transformers 進行優化的架構,而 transformers 則是支援 OpenAI 聊天機器人明星的底層 AI 方法。通過與 AI 研究人員的密切合作,英偉達在 2017 年就注意到了 transformers 的出現,并開始相應調整自己的軟體。

AI 初創企業投資方 Air Street Capital 的普通合夥人 Nathan Benaich 指出,“英偉達可以說比其他人更早看到了未來,并将重點放在了 GPU 可程式設計方面。在發現機遇并押下賭注之後,英偉達獲得了持續領先于競争對手的優勢。”

Benaich 估計,英偉達比其他競争對手要領先約兩年。但他也補充稱,“英偉達硬體和軟體方面的市場地位恐怕還達不到堅不可摧的水準。”

Stability AI 的 Mostaque 對此表示贊同。“谷歌、英特爾和其他公司打造的下一代晶片正在迎頭趕上。而且随着軟體标準化的普及,就連 Cuda 也不足以構成可靠的技術護城河。”

但對 AI 領先的另一些從業者來說,華爾街本周的熱情似乎有點過度樂觀。不過晶片咨詢公司 D2D Advisory 創始人 Jay Goldberg 仍然承認,“從目前的情況看,AI 半導體市場仍然保持着英偉達赢家通吃的局面。”

參考連結:

https://www.ft.com/content/315d804a-6ce1-4fb7-a86a-1fa222b77266

本文轉載來源:

https://www.infoq.cn/article/e95bPU2tu1o9eGQqmQvP

繼續閱讀