天天看點

性能暴降92%!英特爾向中國市場推出兩款“特供版”AI晶片【附全球人工智能晶片行業現狀分析】

作者:長江雲
性能暴降92%!英特爾向中國市場推出兩款“特供版”AI晶片【附全球人工智能晶片行業現狀分析】

(圖檔來源:攝圖網)

英特爾(Intel)最近在官網上釋出了一份名為“Gaudi 3 AI加速器白皮書”的報告,揭示了他們即将在中國發售

Gaudi 3

兩款“特供版”AI晶片産品。這兩款硬體形态加速卡分别是型号為HL-328的OAM相容夾層卡(Mezzanine Card)和型号為HL-388的PCle加速卡,預計将于今年6月24日和9月24日推出。

據報道,原版Gaudi 3在FP16/BF16上的性能可以達到1835 TFLOPS,而中國特供版Gaudi 3的16bit性能将不超過150 TFLOPS。相比國際版Gaudi 3,中國特供版的HL-328晶片性能或将降低約92%左右。這意味着中國特供版Gaudi 3的TDP(熱設計功耗)也将大幅降低。

Gaudi 3在AI加速領域的強大性能和效率,尤其在大模型訓練和推理方面表現出色。國際版Gaudi 3擁有128GBHBMe2記憶體容量、3.7TB記憶體帶寬和96MB闆載靜态随機存取記憶體,可以滿足大模型的超大記憶體需求。而Gaudi 3的訓練時間平均比英偉達的H100縮短了50%。在Llama-2 7B/70B以及Falcon180B大模型的推理測試中,Gaudi 3的吞吐量平均比H100快了50%,平均推理效率快了40%。

人工智能晶片發展路徑

人工智能作為一項計算密集型的新技術,在早期發展階段依賴通用晶片的性能迅速發展,而後期将依賴專用晶片來主宰市場。定制的硬體能夠實作更優的功耗效率,滿足不同算法、結構、終端和消費者的需求,實作規模化的收益。然而,通用晶片與專用晶片永遠不是互相替代的關系,二者必須協同工作才能發揮出最大的價值。

性能暴降92%!英特爾向中國市場推出兩款“特供版”AI晶片【附全球人工智能晶片行業現狀分析】

人工智能晶片分類

目前,人工智能晶片根據技術架構可分為CPU、GPU、FPGA、ASIC和類腦晶片;根據在網絡中的位置可分為雲端AI晶片、邊緣AI晶片和終端AI晶片;按實踐目标可分為訓練晶片和推理晶片。

性能暴降92%!英特爾向中國市場推出兩款“特供版”AI晶片【附全球人工智能晶片行業現狀分析】

全球GPU晶片出貨量超過4.6億片/年

GPU是目前市場上應用最廣泛、在AI計算方面最成熟的通用晶片。根據弗若斯特沙利文的推算,2020年GPU晶片在AI晶片市場占據了35.95%的主要份額。

近年來,全球GPU技術迅速發展,不僅滿足了傳統圖形應用需求,還在科學計算、人工智能和新型圖形渲染技術方面得到廣泛應用。這些技術的成熟應用推動了全球GPU晶片市場的持續高速發展。據全球知名調研機構JPR的資料顯示,2021年全年全球GPU晶片的出貨總量超過4.6億片,每個季度的出貨量維持在1-1.3億片之間。

性能暴降92%!英特爾向中國市場推出兩款“特供版”AI晶片【附全球人工智能晶片行業現狀分析】

根據IDC的預測,随着智能手機需求逐漸複蘇以及對AI晶片的強勁需求,半導體市場将在2024年重新回到增長趨勢,年增長率預計将超過20%。

另據Omdia的預測,全球機器人人工智能晶片組市場規模預計将達到8.66億美元,這将有助于推動GenAI在機器人領域的普及化。

IDC亞太區半導體研究進階研究經理Galen Zeng指出,記憶體晶片制造商對供應和産量的嚴格控制導緻晶片價格自去年11月初開始上漲。預計人工智能的需求将推動2024年整體半導體銷售市場的複蘇。

前瞻經濟學人APP資訊組

更多本行業研究分析詳見前瞻産業研究院《全球人工智能晶片(AI晶片)行業市場調研與發展前景研究報告》

同時前瞻産業研究院還提供産業大資料、産業研究報告、産業規劃、園區規劃、産業招商、産業圖譜、智慧招商系統、行業地位證明、IPO咨詢/募投可研、專精特新小巨人申報等解決方案。在招股說明書、公司年度報告等任何公開資訊披露中引用本篇文章内容,需要擷取前瞻産業研究院的正規授權。

更多深度行業分析盡在【前瞻經濟學人APP】,還可以與500+經濟學家/資深行業研究員交流互動。更多企業資料、企業資訊、企業發展情況盡在【企查貓APP】,成本效益最高功能最全的企業查詢平台。

繼續閱讀