天天看點

“群模亂戰”下中國本土算力能否頂上?距離英偉達還有多大差距?

作者:澎湃新聞

今年以來,新一代人工智能的快速發展,大模型層出不窮,對算力的需求出現爆發式增長,算力供需出現巨大缺口。本屆世界人工智能大會,也成為中國本土算力力量的一次整體展示舞台。

7月6日,華為輪值董事長胡厚崑在昇騰人工智能産業高峰論壇上表示,伴随大模型帶來的生成式AI突破,人工智能正在進入一個新的時代。算力是人工智能産業創新的基礎,大模型的持續創新,驅動算力需求的爆炸式增長。可以說,大模型訓練的效率或者是創新的速度,根本上取決于算力的大小。中國的算力已經成為一個越來越稀缺的資源了。

華為在本次大會上推出首個萬卡AI叢集。目前,昇騰AI叢集已支撐全國25個城市的人工智能計算中心建設,其中7個城市公共算力平台入選首批國家“新一代人工智能公共算力開放創新平台”。

與華為昇騰不同,走通用GPU路線的天數智芯天垓100晶片已經跑通了多個大模型,包括清華大學的大模型GLM,國外主流的LLamA,以及北京智源研究院的Aquila等一些模型。

7日,畢馬威和聯想集團在本次世界人工智能大會上聯手釋出的《普慧算力開啟新計算時代》報告,稱未來算力發展将具備兩大核心特征:“數字經濟的基礎設施”和“通用人工智能的核心動力”。與之相對應,算力将在兩個關鍵次元上加速發展:普适與智慧。

“群模亂戰”下中國本土算力能否頂上?距離英偉達還有多大差距?

華為攜手夥伴聯合釋出昇騰AI大模型訓推一體化解決方案。

昇騰支援國内近半數大模型

人工智能時代,算力的龍頭企業當屬英偉達,無論産品力還是算力生态建構都是首屈一指,也“收割”了本輪人工智能爆發以來最大的利潤。

華為正在建構自己的算力生态。在本屆世界人工智能大會上,華為宣布昇騰AI叢集全面更新,叢集規模從最初的4000卡叢集擴充至16000卡,是業界首個萬卡AI叢集,擁有更快的訓練速度和30天以上的穩定訓練周期。

胡厚崑稱,華為在各個單點創新的基礎上,充分發揮雲、計算、存儲、網絡以及能源的綜合優勢,進行架構創新,推出了昇騰AI 叢集。華為的理念是“DC as a Computer”,相當于把AI算力中心當成一台超級計算機來設計,使得昇騰AI叢集性能更高,并且可靠性更高。

“據我所知,目前我們已經可以達到10%以上的大模型訓練效率的提升,可以提供10倍以上的系統穩定的提高,支援長期穩定訓練。”胡厚崑表示,昇騰AI叢集解決方案,已經在全國25個城市的人工智能計算中心中得到應用,其中,有7個,包括武漢、西安等,成為科技部首批認可的“國家新一代人工智能公共算力開放創新平台”。

華為昇騰計算業務總裁張迪煊表示,為推動人工智能的高速發展,華為将在三個大方向進行引領和創新。首先是引領算力創新,通過系統級的創新從單點算力到叢集算力。第二,突破軟體架構,通過軟硬協同全流程加速大模型開發。第三,使能行業更新,改變開發模式,推動産業的協同,打通技術到行業應用的斷點,讓應用有規模。

張迪煊表示,基于昇騰AI,原生孵化和适配了30多個大模型,到目前為止,中國有一半左右的大模型創新,都是由昇騰AI來支援的。昇騰的生态也逐漸發展壯大,有180萬開發者在昇騰開發平台上工作;與300多所高校院所與昇騰開展合作,每年培養超過10萬名專業的AI人才。

離開了英偉達,本土算力行不行?

由于美國對半導體出口限制,英偉達最先進的A100、H100晶片無法在國内銷售。而英偉達專門針對中國市場推出的A800和H800又缺貨嚴重。那麼,中國本土算力到底能不能頂上?

上海天數智芯半導體有限公司(天數智芯)是一家做通用GPU的晶片公司,天數智芯董事長兼CEO蓋魯江接受澎湃新聞記者采訪時表示:“目前我們已經證明可以用了,不管他們的能不能買,或者賣不賣給中國,我們的産品現在已經在用起來了。”

蓋魯江介紹,天數智芯天垓100是2018年設計的通用訓練晶片,目前這款産品目前已經成功跑通了清華的大模型GLM,包括國外主流的LLamA,北京智源研究院的Aquila等一些模型。

蓋魯江說:“6月9日,我們跟北京智源研究院,在北京釋出了他們的AquilaCode-7B模型,用的就是我們天垓100這款産品在跑,這也充分展現了天數産品的通用性。現在智源的7B跑完了,目前我們正在幫他們跑650億參數的模型,預計10月份可以跑完。”

如果不采用通用架構,客戶進行平台切換門檻比較高。蓋魯江表示,天數在第一階段就走了一條相容國際主流生态的路線,“因為我是通用架構,基于我的硬體去做軟體棧的開發,再在API接口層面相容國際主流生态,這樣其實讓我們的下遊客戶能更友善地用起來,讓他們的遷移成本很低。是以說在商業化這條路上,我們已經率先邁出了一步。”

蓋魯江表示,截至2022年底,天數累計訂單大概接近6個億,2022年全年确認收入在2.5億元左右。

另一家AI晶片公司燧原科技已擁有邃思系列晶片、雲燧訓練和推理加速卡和雲燧智算機的全系列算力産品線。

燧原科技展台一位産品經理接受澎湃新聞記者采訪時表示,燧原科技産品主要供給各地的人工智能算力中心、科研院所用的算力中心。“至于國産算力能否替代英偉達的晶片,這個有個灰階問題,今天所有的産品放在三五年前都是非常領先的産品,但你有一個英偉達在那裡作為标杆,那你性能上就會去對标。”他表示,有些領域還是會用英偉達的産品,而信創等國家非常重要的領域會更多采用本土算力。

張迪煊被問及華為昇騰晶片與英偉達對标的産品性能比對時稱,“根據客戶使用回報,兩者對比在0.9-1.2左右”。他還表示,客戶從其他平台遷移到生态平台,整體上性能和成本效益與原來差不多。

根據畢馬威和聯想聯手釋出的報告資料:放眼全球,算力已成為各國科技戰略布局重點。目前,美、中、歐、日基本穩居全球算力産業規模前四,美、中兩國處在領先地位且中國算力規模增速明顯領跑。各國算力投資或補貼計劃均超千億。

經初步測算,到2025年,資料中心、雲計算、人工智能市場規模總計将突破2.5萬億元,算力核心産業規模将不低于4.4萬億元,關聯産業規模可達24萬億元,成為與新能源汽車比肩的超萬億級高潛賽道。

對比中美兩國細分算力規模來看,中國的智能算力規模已經超過美國60%,主要得益于人工智能模型訓練算力需求快速增長背景下,中國不斷加快了以智能計算中心為代表的智能算力基礎設施建設。

繼續閱讀