天天看點

拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察

作者:動點科技
拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察
拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察

中國特供版的Gaudi 3需要大幅降低AI性能,才能合規出口。文 |動點科技

作者|黃塵排版|李婷婷本文預計閱讀時長8分鐘近日,有外媒稱,英特爾準備針對中國市場推出“特供版”Gaudi 3,包括名為HL-328的OAM相容夾層卡和名為HL-388的PCle加速卡兩種硬體形态。報道指出,英特爾在其Gaudi 3白皮書中披露了上述資訊,其中HL-328将于6月24日推出,HL-388将于9月24日推出。令人震驚的是,基于核心數量、工作頻率、TDP等參數估算,相比Gaudi 3國際版,中國“特供版”HL-328晶片性能或降低約92%。中國特供版有何不同具體硬體規格方面,中國特供版的Gaudi 3與原版相比,具有相同的96MB SRAM片上存儲,128GB HBM2e高帶寬存儲,帶寬為3.7TB/s,擁有PCIe 5.0 x16介面和解碼标準。但是,由于美國對于AI晶片的出口管制規則限制,使得這類高性能AI的綜合運算性能(TPP)需要低于4800才能出口到中國, 這意味中國特供版的Gaudi 3的16bit性能不能超過150 TFLOPS。根據英特爾公布的資料顯示,Gaudi 3在FP16/BF16上可以達到1835 TFLOPS,相比英偉達H100在大模型訓練方面快40%、推理能效高50%。顯然,中國特供版的Gaudi 3需要大幅降低AI性能,才能合規出口。是以,中國特供版Gaudi 3需要大幅削減核心數量(原版擁有8個矩陣數學引擎和64 個張量核心)和工作頻率。

拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察

去年7月,英特爾就釋出了面向中國市場的Gaudi 2。相比國際版Gaudi 2,面向中國市場推出的加速卡在性能上差别不大,而內建以太網RDMA端口數量從24個端口減到21個,以符合美國晶片出口管制規定。美國如何挾制算力20世紀90年代,美國占全球晶片産量的三分之一以上,這一份額到2020年已降至12%左右。為了維護半導體領域的領先地位,自2022年8月美國釋出《晶片和科學法案》(CHIPS and Science Act,下稱“《晶片法案》”)以來,美國對中國實施了全面的半導體出口管制,從晶片本身到晶片制造裝置,限制措施不斷更新。《晶片法案》是拜登政府複興産業政策的核心,其利用美國政府資金恢複對國家安全和經濟增長至關重要的技術部件的國内生産。該法案禁止獲得補貼的美國及其盟友夥伴的企業十年内在中國和其他關切的國家建立或擴大先進制程晶片廠。2022年10月、2023年10月,美國商務部工業和安全局(BIS)連續兩次釋出對中國的先進半導體和計算裝置的出口管制,企圖讓中國先進制造受影響,并且英偉達、AMD、英特爾的多款GPU和 AI 晶片産品已不能再出口到中國,就連高端遊戲顯示卡RTX 4090都受到了限制。2023年12月,美國商務部BIS宣布啟動對成熟制程節點的半導體供應鍊展開調查,更是明晃晃地針對中國晶片半導體産業。中原標準時間今年3月30日淩晨,美國商務部下屬的工業與安全局(BIS)釋出“實施額外出口管制”的新規措施,修訂了BIS于2022、2023年10月制定的兩次出口限制新規,全面限制英偉達、AMD以及更多更先進 AI 晶片和半導體裝置向中國銷售。此次新規中,制裁大棒再次揮舞。BIS删除和修訂了部分關于美國、中國澳門等地對華銷售半導體産品的限制措施,包括中國澳門和D:5國家組将采取“推定拒絕政策”,并且美國對中國出口的 AI 半導體産品将采取“逐案審查”(case-by-case review)政策規則,包括技術級别、客戶身份、合規計劃等資訊全面查驗。

拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察

英特爾勇氣何來雖然還未上市,但英特爾的特供版Gaudi 3極有可能帶來一些潛在的問題。例如,性能降低可能會影響中國企業使用者體驗和應用效果;同時,如果特供版晶片在價格上沒有優勢,那麼其市場競争力可能會受到一定影響。是以,英特爾需要在産品設計和定價等方面做出合理的權衡。兩個月前,英偉達對華“特供版”AI晶片H20的終端産品已可接受預訂。産品形态包括計算卡和搭載8張H20計算卡的伺服器。從性能上來看,英偉達H20性能約為H100的六分之一,但價格并未顯著降低,是以成本效益并不高。今年年初,據知情人士透露,自去年11月以來,阿裡巴巴、騰訊等中國大型企業一直在測試英偉達的特供晶片樣本。他們已向英偉達表明,今年向英偉達訂購的晶片數量将遠遠少于此前原計劃購買的、已經被禁的英偉達高性能晶片。即便面臨營收下滑風險,但是英特爾依舊在“精打細算”下過得不錯。在美國政府《晶片法案》推出近2年後,老牌晶片巨頭英特爾3月份宣布獲得高達85億美元的政府補貼以及多達110億美元的特殊貸款支援。據了解,英特爾所獲得的補貼支援來自于2022年拜登政府所出台的《晶片法案》,該法案力争幫助晶片公司在美國建造更多的晶片工廠,将美國打造為晶片制造強國,英特爾目前可謂是“晶片制造業回流美國”這一背景下的最大受益者。從AI市場看,目前英偉達在晶片市場占據着絕對優勢,英特爾希望用産品撬走份額并不容易。富國銀行統計顯示,目前英偉達在資料中心AI市場擁有98%的市場佔有率,而AMD公司的市場佔有率僅有1.2%,英特爾則隻有不到1%。是以對于英特爾來說,緊跟美國政府反而是明哲保身之舉。

拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察

算力緊俏,國産替代進行時算力是大資料時代的生産力,伴随數字經濟的高速發展,特别是AI的爆發,整個社會對算力的需求呈現快速增長态勢。據IDC和浪潮資訊聯合推出的《2023-2024年中國人工智能計算力發展評估報告》顯示,2022-2027年期間,預計中國智能算力規模年複合增長率達33.9%,到2027年智能算力規模達1117.4 EFLOPS。與此同時,中國資訊通信研究院南方分院的從業人員在CITE 2024上表示,目前大陸智能算力全球占比超30%,主要依賴美國英偉達GPU晶片,國産自主算力份額僅為5%,國内TensorfiowPyTorch、Caffe等美國AI架構使用率超過90%。從應用上來看,目前國内如昇騰、寒武紀、天數智芯等主流晶片廠商已完成對主流大模型的适配。業内分析認為,雖然相較于英偉達、AMD的先進晶片還有很大差距,但昇騰910系列等國産GPU 晶片目前基本可以支撐國内的大模型應用,科大訊飛董事長劉慶峰在去年1024 開發者節上曾表示,華為的GPU能力已能對标英偉達A100,并基于昇騰生态推出了“飛星一号”大模型算力平台。而在此前,寒武紀思元(MLU)系列雲端智能加速卡與智象未來自研的“智象多模态大模型”也已完成适配,其聲稱在産品性能和圖像品質方面均達到了國際主流産品的水準。中國大規模替代進口AI晶片的程序正在加速。對于英特爾們來說,關鍵在于如何在滿足美國政策要求的同時,兼顧中國市場需求,保持産品的競争力和大客戶體驗。另一方面,這也為中國本土的AI晶片廠商提供了發展的寶貴機遇,這些廠商需要密切關注市場動态和技術發展趨勢,以應對潛在的競争壓力。

拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察

本文為動點科技記者原創文章,未經授權不得轉載,如需轉載或開白請在背景回複“轉載”。

- - - - - - - - END - - - - - - - -

互動話題

你如何看待中國特供版的Gaudi 3?

快來評論區留下你的觀點吧!

*想要擷取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群裡更有不定期福利發放!

精彩好文值得推薦!

一鍵轉發,戳個在看!

拿中企當冤種?英特爾中國特供芯性能或暴降 92% | 動察

繼續閱讀