天天看點

大模型訓練拉動算力需求 國産GPU發展提速

作者:中國經營報

本報記者 譚倫 北京報道

距離ChatGPT橫空出世逾四個月後,被視為AI大模型訓練算力基礎設施的GPU也在國内迎來需求暴增。

據公開報道,中國網際網路巨頭們自今年初開始向全球GPU龍頭英偉達大量采購GPU,其中僅位元組一家采購金額便超過10億美元,接近2022年英偉達在華銷售的商用GPU收入總和。

訂單量暴增的背後,大模型訓練的需求被認為是主要推動因素。據民生證券不完全統計,截至今年4月末,國内至少已經釋出了30多款大模型産品,涉及各類科技企業,既包括BAT在内的傳統網際網路巨頭,也涵蓋了商湯、科大訊飛等國内AI獨角獸企業,以及搜狗創始人王小川等企業高管為代表的“創業派”。

一家國内AI企業人士告訴《中國經營報》記者,以目前主流的ChatGPT-3.5大模型為例,OpenAI便部署了近3萬顆GPU晶片作為算力叢集,而如果要疊代版本,GPU數量可能還得倍數級增長。“國内的基礎大模型算力要求會低一些,但由于參與競争的企業數量多,GPU總需求規模會非常巨大。”該人士表示。

在此背景下,GPU正迅速崛起為當紅産業。IC Insights資料顯示,2015至2021年全球GPU晶片市場規模增速超過20%,2021年全球GPU晶片市場規模超過220億美元。産業智庫甲子光年預計,2023年中國AI晶片市場規模将達到557億元,其中GPU在AI晶片市場占比約為90%。

英偉達暫無敵手

GPU全稱Graphic Processing Unit,譯稱圖形處理單元,最早作為計算機顯示卡的核心晶片出現,專屬用于進行複雜圖像資料的計算。随着該功能性的需求進化,GPU逐漸成為計算機圖形渲染、遊戲圖形處理領域不可或缺的角色。

“與CPU相比,GPU擁有更多的獨立計算單元,也就是‘核數’。”CHIP全球測試中心中國實驗室主任羅國昭告訴記者,是以,相比于要承擔大量系統管理、控制及程式執行功能的CPU,GPU的角色更為單純,就是計算,故而特别适合作為提供AI算力的基礎核心器件。

公開資訊顯示,與半導體産業鍊一樣,GPU也包括從IP、設計、軟體生态到應用的完整上下遊環節。其中,設計環節被認為是主導GPU能力的領域,目前全球GPU設計企業主要包括英偉達、AMD兩大巨頭,尤其是英偉達,在AI訓練晶片領域,其市場佔有率超過了90%。

據記者了解,AI訓練GPU是針對人工智能大模型訓練任務而設計的特定GPU。AI模型訓練通常涉及大規模的矩陣計算和深度神經網絡的訓練,這些計算密集型任務可以通過GPU的并行計算能力加速。AI訓練GPU通常具有更高的算力和更大的顯存容量,以支援大規模模型和資料集的訓練。

“英偉達的幾款專用晶片是目前針對大模型訓練的性能最優的算力平台,沒有競争者。”半導體産業分析師季維告訴記者,這也造成了全球大模型廠商都在求購英偉達專用GPU用于資料訓練的局面,而不單單是中國廠商。

季維向記者表示,從産業健康度而言,一家獨大并不是良好的産業生态,但在大模型訓練領域是個特例,因為尚未出現有力的競争者。記者注意到,英偉達專用GPU的供不應求,也助推其日前市值一度突破1萬億美元,成為首個達成這一成就的晶片企業。

中國産業鍊趕超

雖然在用于AI大模型訓練的專用GPU市場,中國廠商還未有足夠能力涉足,但巨大的算力需求所帶來的市場動力,已讓中國半導體産業走在追趕之路上。

通用GPU是布局最早的領域。在雲計算業務的推動下,國内四大網際網路巨頭以每隔一年的速度先後推出通用GPU晶片。其中,2019年,阿裡率先釋出了AI晶片含光800;2020年,百度量産第一代AI晶片昆侖;2021年,騰訊釋出視訊處理晶片“滄海”和AI晶片“紫霄”。2022年7月,位元組也正式确認了其在自主造芯方面的布局,覆寫視訊平台、資訊和娛樂應用等領域。

季維告訴記者,差別于用于AI大模型訓練的高性能GPU,通用GPU更多用于各種通用任務,包括具有高度的并行計算能力和大規模的計算核心,也可以同時處理大量資料,提供較高的計算性能和吞吐量。目前,國内廠商推出的通用GPU更多用在大模型的推理過程中。

“雖然性能上目前通用GPU還無法替代AI訓練GPU,但二者差距也在縮小,通用GPU也可以用于AI訓練任務,并通過适當的軟體和優化實作相對較高的性能。”季維表示,百度CEO李彥宏今年3月便曾在亞布力中國企業家論壇上透露,昆侖晶片現在很适合做大模型的推理,将來會适合做訓練。

與此同時,國内GPU專業賽道也開始湧現燧原科技、天數智芯、摩爾線程等一衆新勢力明星公司。以摩爾線程為例,其量産的“蘇堤”和“春曉”兩顆全功能GPU晶片,可以同時完成圖形渲染、視訊編解碼、AI計算加速、實體仿真、科學計算四大功能。

“這兩年,大陸GPU産業整體還是有了長足進步,橫向比尚有差距,但跟我們自己比,已經出現很多具備創新力的新興廠商,這一點是我們應該看到的。”羅國昭表示。

國産化挑戰待解

随着廠商紛紛入局,中國GPU産業已開始漫漫征程,與此出現的挑戰,也成為目前全産業發展必須面對的問題。

在業内看來,國産化率仍是大陸GPU産業需要解決的首要問題。據官方釋出的相關資料顯示,2019年,中國晶片的自給率僅為30%左右,其中涵蓋GPU在内的可編輯邏輯器件的國産化率僅為1%。

“東數西算等大戰略的推進,意味着國内雲伺服器會在未來與網絡一樣成為數字基礎設施。GPU作為目前雲伺服器的核心器件,重要性不言而喻。”季維表示,大陸2020年印發了《新時期促進內建電路産業和軟體産業高品質發展的若幹政策》,也再次對于強調了提供中國晶片自給率的重要性。

對此,從軟體架構入手,也被認為是國産GPU邁向崛起的關鍵一環。中信證券研報指出,以英偉達專屬軟體棧CUDA為例,由于其閉源特性,以及快速的更新,後來者很難通過指令翻譯等方式完美相容,即使部分相容也會有較大的性能損失,導緻在成本效益上持續落後英偉達。

在日期舉行的行業會議上,天數智芯副總裁鄒翾也明确表示,本土GPU企業要抓住AI大模型興起的産業機遇,需要從底層定位大模型的算力需求,而架構正是其中之一。

對此,記者注意到,日前國内企業中天恒星國推出了國産GPU架構“天狼星”。據中天恒星聯合創始人兼總架構師鄧仰東表示,此次“天狼星”架構的設計為完整自主研發,從數學公式推導開始,架構設計、算法模型、原理驗證、硬體實作和驅動開發等環節全部正向設計,核心IP完全自主可控,擁有圖形GPU完整知識産權,并已申請專利和著作權數百項。據悉,“天狼星”架構晶片設計驗證完成于2019年,2021年正式誕生,今年該架構将正式實作量産。

中信證券研報指出,外部不确定因素疊加内部加速自主創新背景下,國産GPU廠商有望加速崛起。伴随政策大力扶持、國際科技貿易政策影響、國産廠商産品性能提升及生态逐漸完善,國産GPU龍頭正迎來關鍵發展機遇。

(編輯:張靖超 校對:顔京甯)