天天看點

誰能先“甩”了英偉達?

誰能先“甩”了英偉達?

OpenAI也在騎驢找馬,想要盡快擺脫對英偉達的依賴。

據路透社,至少從去年開始,OpenAI就已經讨論了各種方案,希望能解決晶片又貴又短缺的問題。其中,自研晶片是方案之一,目前這個方案仍然沒有被完全否定。

另一個方案是直接收購一家晶片公司。知情人士稱OpenAI已經有潛在的收購目标,并曾考慮對其進行盡職調查。但報道中未能确定具體是哪家晶片公司。

巧合的是,另一個消息與之相伴而出——微軟将在下個月的年度開發者大會上,推出其首款為AI設計的晶片“雅典娜(Athena)”。

誰能先“甩”了英偉達?

據The Information援引知情人士,雅典娜将用于資料中心伺服器,為訓練大語言模型等設計,同時支援推理,能為ChatGPT背後的所有AI軟體提供動力。

雲已經成為大模型的重要戰場,而微軟在該領域的兩個競争對手谷歌和亞馬遜,都早已擁有了自己的AI晶片。雅典娜的推出将讓微軟補全短闆。

微軟和OpenAI在晶片問題上的進展頗有代表意義:論角色,正是微軟、OpenAI和英偉達的三方聯手,讓ChatGPT變為現實,繼而引發了一場全球性的AIGC新浪潮;論時間,下個月正是ChatGPT推出整一年的節點。

大模型競争的下一個焦點似乎是“誰能先‘甩’了英偉達”,在晶片領域具備統治力的英偉達,已經成了一種亟需擺脫的束縛。

A

2016年,成立僅一年的OpenAI迎來一位貴客,英偉達CEO黃仁勳。他親自将首個輕量化小型超算DGX-1送給了OpenAI,OpenAI一年的計算量可以靠DGX-1在一個月内完成。

如今,後知後覺的人們回頭看黃仁勳在DGX-1上的簽字“為了計算和人類的未來”,驚呼“皮衣教主”的毒辣眼光。

到了2019年,微軟牽手OpenAI,為其打造的超級計算機用上了上萬個英偉達A100 GPU。就這樣,OpenAI出力、微軟出錢、英偉達出基建,用驚人的算力支撐着OpenAI大模型的研發,并最終大力出奇迹,ChatGPT于2022年11月推出,驚豔世界。

誰能先“甩”了英偉達?

OpenAI成為明星企業,微軟以AI戰略與谷歌等展開激烈厮殺,而英偉達公司市值更是從去年11月的3000多億美元,飙升到如今的超萬億美元。全球掀起大模型熱,英偉達作為“賣水翁”,晶片不愁賣。

今年7月,花旗研究分析師Christopher Danely在一份報告中指出,英偉達将占據AI晶片市場“至少90%”的市場佔有率。

然而,這場“三赢”的遊戲中,卻可能隻有黃仁勳是全然快樂的。對于微軟和OpenAI為代表的“買水人”來說,依賴英偉達的晶片至少有兩個問題。

第一個問題是貴。對于為OpenAI搭建的超算,據彭博社報道,微軟在該項目上的花費了數億美元。伯恩斯坦研究公司分析師Stacy Rasgon分析,ChatGPT每次查詢都要花費約4美分。如果ChatGPT的查詢量規模增長到谷歌搜尋的十分之一,則需要大約481億美元的GPU,并且每年還需要160億美元的晶片才能維持運作。

第二個問題是稀缺。就在今年6月,OpenAI CEO阿爾特曼(Sam Altman)在一場會議上稱,晶片的短缺阻礙了ChatGPT的發展。面對客戶對API可靠性和速度的抱怨,阿爾特曼解釋大部分問題都是由于晶片短缺造成的。

今年新釋出的英偉達H100是目前最熱門的AI晶片,但隻能滿足一半的市場需求。英偉達H100和A100均由台積電生産,台積電董事長劉德音上個月曾解釋稱,供應限制不是由于缺實體晶片,而是先進晶片封裝服務(CoWos)的産能有限,而這是制造過程的關鍵步驟。

劉德音還預計,一年半後技術産能将足以滿足客戶需求,也就是2024年底AI晶片供應緊張可能會得到緩解。

雖然雅典娜可能在今年才會推出,但微軟已經為此準備多年。在豪擲數億美元為OpenAI打造超算的2019年,微軟的雅典娜項目已經啟動。根據爆料,雅典娜會使用台積電5nm工藝打造,直接對标英偉達A100,預計每顆成本降低三分之一。

B

對于英偉達來說,微軟和OpenAI的私心是一個紅色信号。

微軟是英偉達最大的客戶之一,甚至傳出過“包圓”H100全年産能的消息,OpenAI則是AIGC領域最重要的風向标。二者自研晶片的心,是英偉達頭頂的一抹烏雲。

谷歌曾是最早大規模采購GPU來進行AI計算的公司,但後來研發自己的AI專用晶片。在2016年就已經釋出了第一代TPU(張量處理單元),随後在2017年作為Google Cloud基礎設施Google TPU推出。這些年來谷歌一直在持續疊代,今年4月其公布了TPU v4的細節,稱其比英偉達的A100強1.7倍。

雖然谷歌仍然在批量采購英偉達GPU,但其雲服務已經用上了自家的TPU。在這次的AIGC大戰中,AI繪圖公司Midjourney、有ChatGPT競品Cloude的獨角獸公司Anthropic,都不是像OpenAI一樣從英偉達采購晶片搭建超算,而是使用了谷歌的算力。

另一個科技巨頭亞馬遜也動作頗早,在2015年收購以色列晶片初創公司Annapurna Labs,為其雲基礎設施開發定制晶片,三年後推出了基于Arm的伺服器晶片 Graviton。後來,亞馬遜推出以人工智能為重點的晶片Inferentia, Trainium。

誰能先“甩”了英偉達?

上個月,消息稱亞馬遜将向Anthropic投資40億美元,作為交易的一部分,Anthropic 将使用 AWS Trainium 和 Inferentia 晶片來建構、訓練和部署其未來的基礎模型。

除此之外,英偉達的其他競争對手也在向AI晶片領域發起進攻。AMD、英特爾、IBM等正陸續推出AI晶片,試圖與英偉達的産品抗衡。今年6月,AMD就釋出了Instinct MI300,直接對标英偉達H100,是專門面向AIGC的加速器。其內建的半導體數量達到1530億,高于H100的800億,是AMD投産以來最大的晶片。AMD甚至用相容英偉達CUDA的政策,降低客戶的遷移門檻。

不可否認的是,目前英偉達仍然幾乎壟斷AI晶片市場,沒有競争對手撼動其地位,也沒有一家科技巨頭可以完全擺脫對它的依賴。

但“降低英偉達的控制力”似乎成為一種共識,外部挑戰一浪接着一浪。微軟和OpenAI自研晶片的消息,就是新的一浪。英偉達能穩站岸頭嗎?

參考資料:

1、機器之心:《亞馬遜剛投40億美元,谷歌等又要投20億,Anthropic估值狂飙》

2、新浪科技:《AI晶片短缺拖累科技公司收益 英偉達H100據稱明年出貨至少增兩倍》

3、CSDN:《 燒數億美元、耗上萬顆英偉達 GPU,微軟揭秘建構 ChatGPT 背後超級計算機往事!》

4、華爾街見聞:《放下驕傲!微軟是如何豪賭OpenAI的》

5、界面新聞:《微軟自研AI晶片“雅典娜”浮出水面,欲打破英偉達算力壟斷》

6、遠川研究所:《英偉達帝國的一道裂縫》

繼續閱讀