天天看點

瘋搶AI晶片:機房拆舊貨,一片賣10萬

作者:市界觀察

01、像賣愛馬仕一樣賣晶片

今年以來,大模型和AI 2.0既是最火熱的創富夢,也越來越成為一個昂貴的“權力的遊戲”。在技術、資本、人才等建構出的種種門檻中,還有一張重要的入場門票——你有沒有“門路”能搞到足夠的英偉達高端顯示卡。

王非是華東地區一家伺服器定制企業的銷售部經理,他向「市界」描述了最近英偉達顯示卡的緊俏程度:“需求太火爆,有些人從機房裡把晶片禁運政策生效前購買的A100 80GB拆出來倒賣。”這些舊晶片不隻沒有保修,相比于去年8月前後8萬多元的單價,價格還漲到了10萬多元。

即便已經舊貨拆賣、物盡其用,顯示卡的供應還是嚴重不足。“需要拿現款去,對方才願意賣給你。”而相對顯存較小、訓練效率低的A100 40GB即便有全新的,也乏人問津。“詢價的多,成交的少。”

具體而言,這批搶手的顯示卡指的是英偉達旗下的“Tesla”系列産品。在訓練AI大模型時,比傳統CPU更高效的GPU(圖形處理器,又稱顯示晶片),尤其是高端GPU一芯難求。

2020年和2022年,英偉達先後推出了A100晶片、H100晶片,其中A100顯示卡又提供80GB、40GB兩個顯存版本,H100則提供80GB顯存。顯存越大,所能運作的神經網絡也就越大。

2022年9月開始,美國禁止英偉達等向中國出口高端GPU晶片。為應對禁運政策,英偉達又在2022年和2023年分别推出了特供中國版的顯示卡A800和H800。

不過如今,在政策允許範圍内的A800晶片,在市場上也出現了供貨周期拉長、價格上浮的現象。王非透露:“在大模型火爆之前,A800大概兩周即可到貨。但現在我跟客戶保守估計要在8周内,即便是最樂觀的情況,也需要4-6周。”

供職于北京一家顯示卡分銷企業的郭麗婕對「市界」表示:現在公司的A800單卡報價為8.75萬元,已經超出了A800在2022年11月時8萬-8.5萬元的價格區間。而且,8.75萬元隻是實時報價,顯示卡還有繼續漲價的趨勢。“我告訴客戶确定要了再找我聊,現在的庫存也不多。”

另一家位于深圳的顯示卡供應商,則給A800開出了8.95萬元的報價——更高的溢價意味着等待時間較短,需要大約兩周的貨期。

作為算力基礎設施,競購英偉達高端顯示卡晶片已經成了一種“搶跑遊戲”。而決定AI創業公司成敗的要素之一,“就是你到底有沒有能力調動最起碼100張以上的英偉達顯示卡。”一家AI創業公司負責人對「市界」講到。

他透露:“在去年8月之前,通過國内正規管道,還能買到A100顯示卡,也可以采購海外版A100。在此之後,國内A100被切斷了貨源,從海外采購海關也不會放行。”

不過那些允許被特供中國的A800和H800晶片對于緊缺算力的AI中小公司而言,同樣是遙不可及。

王非透露:“一般來說英偉達的貨先到國内總代,再被我們這類廠家分走,銷售給做AIGC項目的客戶。目前H800雖然已經發售,預計單卡售價會在20萬起,也沒有進入我們這一級市場。現在能拿到H800的,應該隻有阿裡雲、騰訊雲這種有資格從英偉達原廠直接采購的大廠商。”

在市場緊俏的背景下,H800等高端晶片已經提前被大廠包攬。目前,國内僅有騰訊雲官宣“用上”了H800。4月14日,騰訊雲釋出了基于H800的大規模算力叢集,并将其定義為H800的“全國首發”。

據《晚點 LatePost》了解,位元組今年向英偉達訂購了超過 10 億美元的 GPU,僅位元組一家公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU 總和。大公司的合作方式主要是和英偉達原廠直接談采購,能否搶到卡,更多是看商業關系,比如以往是不是英偉達的大客戶。

而在龐大的需求面前,據傳英偉達甚至開始學起了愛馬仕,在購買搶手的 GPU 時,也需購買其它産品作為取得優先供應權的“配貨”。

在這場大模型研發競速賽中,相比超級大廠,更多小玩家隻能先把名字寫進等待名單。而無論哪一方曆經蕩滌、最終勝出,作為算力供應者的英偉達都能穩拿訂單,笑到最後。

02、黃仁勳的運氣有多好?

在商界一直有一種說法:當淘金者蜂擁而至時,獲得财富就變成了小機率事件。最後掙到錢的,更可能是站在淘金者身邊“賣鏟子”的人。

一位科技賽道的投資人對「市界」回憶:在前幾年的AI行業資本寒冬中,“泡沫破滅時,投資人和企業突然意識到,(算法創業)成本極高,都是在虧錢,反而讓上遊賺錢了。”

而在AI這個近年來最大的科技風口面前,英偉達便是那個第一批站在上遊、得以幸運“起飛”的公司。

在今年5月舉辦的英偉達業績電話會上,英偉達創始人、總裁兼CEO黃仁勳直言:今年1月以來出現的新産品需求“不可思議地陡峭”,公司訂單“多到難以置信”。

不僅市場對英偉達産品瘋狂競逐,資本也展現出了慷慨的态度。5月30日,英偉達成為全球首家市值突破萬億美元的晶片設計商。

瘋搶AI晶片:機房拆舊貨,一片賣10萬

▲(2015年至今英偉達股價走勢圖)

當有記者向黃仁勳提問:“(在新一輪AI浪潮中)英偉達獲得的豐厚回報是因為運氣,還是因為有先見之明?”黃仁勳并不諱言英偉達人氣暴漲的“運氣”成分:“我們隻是相信總有一天會有新的東西發生,其餘的需要一些偶然性。”

如今已經無人在意,短短一年之前,英偉達還陷在營收不及預期、股價滑坡的漩渦之中。如果沒有AIGC的“天降神力”,看上去這将是一個已發生過無數次的“商業先行者”遺憾折戟的故事。

過去數年間,英偉達的高端顯示卡更多被用于PC遊戲和虛拟貨币“挖礦”之上。疫情之下,受益于消費電子需求暴增,英偉達股價也随之連番上漲。2021年,英偉達股價最高升至300多美元,創曆史高點。

但進入到了後疫情時代,随着遊戲市場遇冷,疊加虛拟貨币持續波動,2023财年的前三個季度中,英偉達營收連續下滑,淨利潤大幅縮水。與之相應的,公司股價在2022年8月,跌至了年内最低的每股108美元。與2021年高點相比,市值僅餘三分之一。

不過,到了2022年底,随着ChatGPT橫空出世,英偉達一舉扭轉頹勢,成為了被全球追捧的明星。截至6月23日美股收盤,英偉達股價已升至422.90美元。

瘋搶AI晶片:機房拆舊貨,一片賣10萬

在英偉達一飛沖天的同時,人們開始追溯,這是否是一個關于決策者“深謀遠慮”的故事。而黃仁勳本人對此的定義是:“這不是先見之明。先見之明是加速計算。”

因為在某種程度上,用GPU訓練AI模型的曆史正是由英偉達開啟的。

2010年,據媒體報道,英偉達首席科學家兼進階研究副總裁Bill Dally與其好友、全球AI領域權威學者吳恩達某天在咖啡店裡共進早餐。彼時,吳恩達正在谷歌進行AI研究,但在推進課題過程中遇到了算力不足問題。

如果想要補上吳恩達團隊面臨的算力缺口,谷歌需要新購置約1.6萬塊CPU(中央處理單元)。以英特爾在2010年釋出的伺服器CPU産品至強X5680為例,後者當年的單價約為1666美元,1.6萬塊合計需要約2700萬美元。

這筆預算足夠讓吳恩達的研究胎死腹中。據資料分析機構“PitchBook”調研,2010年全球AI和機器學習領域獲得的風險投資還不足5億美元。

Bill Dally聽說了吳恩達的煩惱後,建議他用英偉達的GPU替代CPU來進行AI訓練。由于CPU采用串行計算方式,更擅長邏輯控制,但資料處理效率較低。而英偉達的GPU産品采用了其自研的并行計算架構“CUDA”,能夠将任務分解成若幹部分同時解決。最終,吳恩達團隊果然僅用48塊GPU并聯,就解決了問題。

在此之後,越來越多的研究團隊開始将英偉達晶片用于AI訓練使用。而黃仁勳也在看到AI市場的巨大機遇後,從2012年開始,将AI列為了重要的發展方向。

某種程度上,在10年前AI落地應用還是模糊一片的背景下,便在深度學習層面開始布局,确實代表了黃仁勳的“先見之明”。

就職于矽谷某AI晶片獨角獸公司的Lee對「市界」講到:對晶片企業而言,在2012年投入深度學習的計算是一個非常難得的選擇。據他回憶:“2012年是大資料時代的巅峰,最賺錢的市場是網際網路資料庫、檔案系統等等,做深度學習可以說是’冷闆凳’。而且英偉達是圍繞着深度學習的主題進行全方位、點點滴滴的下注,包括完善語言設計、開發者工具等周邊軟體工具。”

03、國産GPU奮力追趕

對于英偉達的成功原因,黃仁勳曾這樣總結:“我們很早地,大約在10年前就發現,(AI)這種制作軟體的方式可以改變一切。我們從底層一直到頂層,從各個角度改變了公司。”

從2016年開始,英偉達旗下的加速計算GPU産品線(代号“Tesla”)開始專門針對AI訓練任務進行設計。這一年推出的晶片型号為P100,同時配備有英偉達新研發的高速互聯技術“NVLink”。而NVLink能夠允許CPU、GPU晶片間進行高速互動,進一步提升了運算效率。

從底層到頂層搭建起的軟硬體産品生态,也是英偉達在這輪AI風口,因其長期布局和最大的确定性,得以受到資本熱捧的原因。但從市場、技術等角度考慮,英偉達當下建構的“算力帝國”也還遠遠談不上固若金湯。

根據2023财年财報顯示,中國是英偉達的第一大目标市場,英偉達在中國市場實作的營收占其全球市場營收的47%。而在政策限制下,英偉達難以向中國市場銷售A100、H100高端晶片,無疑将對其營收造成重擊。

黃仁勳個人,從不掩飾對于中國市場的期望。5月底他在接受《金融時報》采訪時,抱怨美國政府對于半導體技術的出口限制使得英偉達束手束腳,警告持續更新的中美晶片戰将令美國科技業面臨遭受“巨大損害”的風險。“如果失去了中國市場,我們并沒有應急計劃。因為世界上沒有其他中國,中國隻有一個。”

但在英偉達高端顯示卡出口受阻的态勢下,許多中國客戶不得不轉向其他選擇。而細細數來,市場中英偉達的挑戰者并不少。

王非告訴「市界」:“我一些做AIGC項目的客戶選擇了海光的國産顯示卡DCU Z100L。據我所知,海光的産品目前已經用到了多個國産大模型裡。”

另一位大模型應用層的創業者則透露,由于買不到A800,其所在的團隊緊急購置了一批英偉達的消費級顯示卡GeForce RTX 4090,“未來會考慮其他選擇,或者更多配置雲計算資源”。

在供應端,天數智芯、摩爾線程等國産GPU廠商已經開始積極推動産品落地于大模型訓練領域。

6月10日,天數智芯對外宣布,經過驗證,其研發的國内首款量産的通用GPU“天垓100”具備支援百億級參數大模型訓練的能力。據稱,在天垓100加速卡的算力叢集支援下,北京智源研究院70億參數的“Aquila”語言基礎模型完成了參數優化工作。6月上旬,摩爾線程則宣布其已經完成對智源研究院“悟道·天鷹”大模型的推理相容适配,整個适配過程僅花費不到6小時時間。

除了國産GPU玩家,“AI晶片第一股”寒武紀、阿裡巴巴旗下晶片企業“平頭哥”的産品同樣可以用于運作AI相關任務。

6月19日,“國産CPU第一股”龍芯中科在投資者交流平台公開表示,其已完成通用GPU相關IP設計,預計第一個內建自研通用GPU核心的SOC晶片(系統級晶片)計劃于2024年Q1流片,在此基礎上将研制兼顧顯示卡和計算加速卡功能的通用GPU晶片,計劃于2024年下半年流片。

伺服器廠商南京坤前計算機的一位客戶經理總結道,在AIGC等大模型應用領域中,國産産品已經可以部分滿足客戶需求。他講道:“不僅是現在,在未來的一段時間内英偉達GPU供不應求也是可預見的,但我認為不必過于追求英偉達。隻要算力叢集足夠大,國産卡也夠用,就算國産卡帶寬少一點,運算的時間多一點,起碼可以實作自主。”

瘋搶AI晶片:機房拆舊貨,一片賣10萬

此外,從6月上旬開始,市場便不斷傳出知名資管機構與大股東對英偉達的減持計劃。實際上,英偉達“算力帝國”的縫隙也已經開始顯現。

6月6日,背後站着老牌歐洲金融世家羅斯柴爾德家族、管理資産近900億美元的愛德蒙得洛希爾資産管理公司透露,已經将部分英偉達頭寸獲利了結。主要原因是:AI估值太高,越來越不确定。如果估值繼續上漲,機構會變得謹慎。知名投資估值專家Aswath Damodaran也表示,賣掉了英偉達的股票,因為“這輪上漲太驚人”。

事實上,黃仁勳自己便可能是矽谷最具危機感的企業家,他曾多次公開提到:“我一直認為我們距離倒閉隻有30天的時間。”最近,他也在采訪中表達了擔心:認為在英偉達因政策而“缺席”的這段時間,中國的GPU初創企業會很快追趕上來。

(文中王非、郭麗婕為化名)

作者 | 董溫淑

編輯 | 李 原

營運 | 劉 珊

繼續閱讀