天天看點

英偉達特供晶片賣不動了?黃仁勳穿上東北花襖“示好”,中國大廠難掩AI野心

英偉達特供晶片賣不動了?黃仁勳穿上東北花襖“示好”,中國大廠難掩AI野心

本文來源:時代财經 作者:謝斯臨 實習生盧倩瑩

英偉達特供晶片賣不動了?黃仁勳穿上東北花襖“示好”,中國大廠難掩AI野心

圖檔來源:Pixabay

算力晶片的火,從2023年一直燃燒到2024年。

開年不久,英偉達CEO黃仁勳時隔四年到訪中國大陸,還穿上了東北大花襖與國内員工共舞,氣氛無比熱絡,似乎是在對自家晶片遇冷的傳言進行某種回應。

2023年,英偉達的AI晶片成了科技界的硬通貨,一度一片難求,英偉達業績也水漲船高,其2024财年第三季度财報顯示,期内英偉達錄得營收181.2億美元,比去年同期增長206%,遠高于市場預期的162億美元,創紀錄新高。

但近期,情況似乎發生了變化。據參考消息網,自去年11月以來,中國網際網路大廠就開始在測試英偉達“中國特供版”AI晶片樣品,結果并不理想——由于算力不足,相關公司已暗示英偉達,今年訂購的英偉達晶片數量将遠少于原計劃。

是以,黃仁勳在這個特殊時間節點突然到訪,引發了市場諸多猜測與遐想。有業内人士認為,在國内廠商不願購買性能縮水的英偉達特供版晶片的情況下,黃仁勳來到中國大陸,很有可能是為了穩住國内團隊和頭部客戶,并了解市場對英偉達産品的需求和回報,以便進行相應的産品和政策調整。

對此,英偉達方面也回應媒體稱,黃仁勳的到訪并未涉及與政府官員的會面,也沒有重大的商業釋出,最主要的目的是與中國員工“歡度美好時光”。

“這反映出大陸相關産業在國際競争中的地位逐漸上升。”深度科技研究院院長張孝榮向時代财經記者分析表示,在政策端的支援以及國内企業的不斷努力下,國内外晶片算力的差距已在不斷縮小,這給予了國内頭部大模型廠商轉投國産晶片的底氣,也為英偉達敲響了警鐘。

H20“遇冷”真相

2023年10月,為了繞過限制并滿足中國大陸市場需求,英偉達着手推出三款基于其AI晶片H100的“降級版”晶片:H20、L20和L2,并計劃在今年二季度量産。

然而這一針對中國市場研發的特供晶片未獲市場認可。性能上的不足,被普遍認為是英偉達晶片遇冷的主要原因。

官方資料對比顯示,H20為三款晶片中性能最佳的一款,更适用于垂類模型的訓練、推理。H20的記憶體高達96GB,整數精度(INT8)算力為296TOPS;L20則配有48 GB記憶體,整數精度(INT8)算力為239TFLOP;L2配置為24GB記憶體以及算力為193TFLOP。

然而即便是三款晶片中最強大的是H20晶片,其運算能力與H100相比還是大幅縮水。

半導體研究機構Semianalysis調研報告曾顯示,理論上H20整體算力比英偉達H100下降80%左右,但在大語言模型(LLM)推理方面的性能比H100快20%,同時配置的HBM3顯存和NVLink互聯子產品增加了不小成本。

此外,多位業内人士向時代财經記者分析表示,性能表現不及預期,并非H20在華遇冷的唯一原因。

華芯金通半導體産業研究院院長吳全向時代财經記者指出,從2023年大模型爆火以來,國内一衆雲計算、大模型廠商就已經開始積極囤貨,大批量購買A800、H800等英偉達晶片,目前已部署的伺服器總量尚能支撐市場需求,故而對“減量不減價”的H20興緻缺缺。

而前人工智能NLP企業首席科學家、千芯科技董事長陳巍進一步向時代财經記者透露,國内交易市場中還囤積有大量英偉達GPU晶片等待消化。這也給予國内大模型廠商一定的選擇餘地。

“估計還有20%的存貨沒有出清。”陳巍表示。

時代财經記者通過詢問小紅書、閑魚APP等線上管道,以及線下走訪華強北晶片交易市場後發現,相比半年前囤貨惜售的場景,現在經銷商手中英偉達存貨普遍較多,側面印證了陳巍的說法。

多位賣家向時代财經記者透露,其目前擁有A100晶片現貨在50個以上,配置不同報價略有波動,單個售價集中在12萬到18萬元區間内,相較去年下半年價格維持穩定。也有賣家要求50-100個起售,交貨周期為1個月,可在中國香港、日本、新加坡進行交易。

此外,陳巍強調,當下市場的觀望态度也與英偉達自身的動作息息相關。

除H20外,2023年底,英偉達中國又在官網釋出了定制的GeForce RTX 4090 D。随後,又于今年1月初,推出了全新消費級顯示卡GeForce RTX 40 SUPER系列,包括RTX 4080 SUPER、RTX 4070 Ti SUPER 和 RTX 4070 SUPER三款GPU,均具備強勁的生成式AI性能。英偉達副總裁Justin Walker在釋出會上強調,英偉達釋出的新顯示卡符合出口要求,可以提供給中國大陸消費者。

陳巍認為,考慮到多數國内大模型廠商的發展趨勢是針對垂直領域開發數十億參數量級或百億參數量級的中小模型,而不是開發類似GPT-3.5 175B這樣的千億級大模型。是以對于雲計算和IDC廠商來說,4090D等消費級顯示卡在雲部署與推理計算上更具備成本效益,H20的吸引力進一步下降。

國産自研AI晶片加速

在爆出H20等“降級版”晶片在華遇冷的同時,參考消息網的相關報道稱,“短期來看,英偉達降級版晶片與中國本土晶片在性能上的差距不斷縮小,增強了中國自産晶片的吸引力。據知情人士稱,阿裡巴巴和騰訊正将一部分高性能AI晶片的訂單轉給本土企業,并更多地依賴内部自研晶片。中國另外兩大晶片買家位元組跳動和百度也是如此。”

時代财經記者通過采訪以及公開資料梳理發現,目前國産AI晶片主要可以分為三類:其一是大型科技企業自研的AI晶片,二是海光資訊這類國資背景的科技公司,三是壁仞科技、天數智芯、摩爾線程、燧原科技、寒武紀等創業型晶片公司。

據晚點統計,上述晶片峰值算力大多相當于英偉達A100的41%到82%。

從實際落地情況來看,絕大部分廠商仍處在商業化應用的早期階段,仍停留在具體場景下的應用。

目前,國内已有科技企業具備全棧AI軟硬産品,能夠真正大規模量産并投入業務使用。其研發的核心産品被普遍認為是性能表現最接近英偉達的國産AI晶片。科大訊飛副總裁江濤曾在一次業績說明會上透露,該晶片的能力已經基本做到可對标英偉達A100。

而據時代财經不完全統計,科大訊飛、百度、360、雲從科技、智譜AI等多家科技企業已在使用該晶片。

事實上,AI晶片的算力比拼隻是第一步,對于國産廠商而言,接下來的生态建構又是新的挑戰。多位從業人士、分析師也一緻認為,從配套生态、供應鍊等多個角度看,大模型廠商依舊難以徹底擺脫對英偉達GPU的依賴。

這不是一家國内廠商的難題。一位AI晶片設計相關的從業者向時代财經記者表示,英偉達于2006年釋出的CUDA平台早已成為應用最為廣泛的AI開發生态系統,這導緻開發者難以脫離英偉達晶片,進行生成式AI的研發以及訓練。

“從這個次元看,幾乎沒有晶片公司可以撼動英偉達的統治地位。”上述從業者說。

還有上市AI企業高管向時代财經記者透露,目前,國産晶片價格基本與英偉達産品一緻,且産能出貨也難達預期。“隻有成為生态合作夥伴,才能勉強保證供應。”

“隻要漸進就是一個好的趨勢”

對國内大模型廠商而言,增加國産AI晶片比重仍是必然之舉。

“保供已經成為一項關鍵的問題。一方面,美國很有可能會采取各種手段保證自身在人工智能領域的優勢;另一方面,全球局勢也可能會影響供應鍊的穩定。基于這樣的預期,市場需要盡早尋得新的方案,這将成為國産AI晶片發展的機會。”陳巍認為。

為抓住這一機會,一衆國産AI晶片廠商都在重點發力,拓展市場。據寒武紀向時代财經記者提供的資料,旗下思元晶片近期接連宣布與百川智能、智象未來等廠商旗下大模型完成全面适配。

“生态建構是目标,晶片隻是基礎,更重要的是在晶片之上建構函括架構平台、軟體工具、作業系統和應用場景等一系列生态體系。英偉達起步早,國産廠商需要快速追趕。”吳全向時代财經記者分析道。

國際資料公司(IDC)披露資料顯示,2023年上半年,中國加速晶片的市場規模超過50萬張。在陳巍看來,這是一個能夠讓那個國産市場佔有率拉升的機會。“隻要漸進就是一個好的趨勢。AI晶片要在實際應用中才能夠發現問題、加快疊代。我們一般認為,市場佔有率占比超過15%之後,生态建設才能真正跑起來。”

吳全形象地将國産AI晶片的發展比喻為樹木的成長,“目前我們隻是種下了一顆小小的樹苗,完成了最基本的培育工作。國内企業仍需在技術創新、人才培養、産業鍊完善等方面付出更多努力。”

繼續閱讀