天天看點

挑戰谷歌!中國公司争奪AI網絡标準

作者:平安江蘇

剛剛,超以太網聯盟UEC技術咨詢委員會選出新成員,阿裡雲成為13名成員中唯一的中國公司,将攜手微軟、Meta、AMD、博通等科技巨頭,推進開放網絡的研發及标準制定,打造下一代AI網絡基礎設施。

而就在前幾日,阿裡雲打造的AI高性能網絡HPN7.0論文入選頂級國際學術會議SIGCOMM,引發業界熱議,專家指出,這一架構極有可能取代此前谷歌提出的Jupiter架構,而成為下一代AI網絡架構标準。

随着大模型浪潮席卷而來,AI基礎設施成為科技巨頭們競相角力的最火熱戰場,而這次,中國占據了難得的先機。

挑戰谷歌!中國公司争奪AI網絡标準

規模提升16倍!

超高性能網絡為中國AI大模型提速

衆所周知,大模型需要大算力。在算力資源極度緊張的當下,隻有通過系統架構的創新,才能實作AI的彎道超車。高穩定、高性能的網絡,則是支撐這一AI基礎設施的關鍵底層技術。

網絡架構及技術來源于西方,也被西方壟斷。谷歌2015年提出的資料中心網絡朱庇特(Jupiter)架構,是最主流的技術線路,主導了業界資料中心網絡架構的設計。

直到2023年9月,阿裡雲推出新一代HPN7.0架構,宣告完成全球首個AI高性能網絡叢集的突破;大半年後,HPN7.0論文被收錄進國際頂會SIGCOMM,國際學術界第一次官方認可了這一重磅新技術。

專家表示,HPN7.0極有可能取代谷歌經典的朱庇特架構,而成為下一代AI網絡主流架構範式和标準。

HPN7.0不是翻修、精裝,而是系統性重構。用一個通俗的比喻,以往的房子能住10個人,好的科技公司一番操作可以往這房子裡塞15人,而阿裡雲直接重新設計打造了一個能容納100人的房子。

一組資料顯示,在傳統通用計算叢集架構下,單層交換機最多支援16~64張GPU極緻性能的直接互聯;阿裡雲AI智算叢集架構HPN7.0,單層交換機可以支援1024張GPU直接互聯。相當于極緻性能互聯的規模直接提升16倍!這就給AI大模型的訓練及推理帶來足夠大的網絡性能保障。

挑戰谷歌!中國公司争奪AI網絡标準

HPN7.0架構:為AI設計的高性能網絡叢集

基于HPN7.0打造的阿裡雲AI基礎設施,可高效協同排程各類晶片,支援高達10萬卡量級的叢集可擴充規模,實作網絡的高性能和高穩定互聯,讓超大叢集像一台計算機般高效運轉,幫助大模型訓練較上代提升性能14.9%。

前不久阿裡雲釋出通義千問2.5版本大模型,中文性能全面趕超GPT-4Turbo,就是基于HPN7.0高性能網絡叢集訓練而成。

可以想見,未來,國内所有公司都能通過阿裡雲而獲得高品質的AI網絡服務,将大大有利于中國大模型發展及應用落地。

擁抱開源

阿裡雲牽頭制定AI智算網絡的“安卓”标準

目前,AI高性能網絡有兩個主要标準,一種是英偉達主導的私有标準InfiniBand,另一種則是RoCE v2(基于融合以太網的RDMA網絡)。

這兩種标準猶如網絡領域的蘋果和安卓:一個自給自足,基本封閉;一個開源開放,最具活力。選擇哪一種标準,基本上就選擇了那種标準代表的全套裝置、系統、軟體及應用。

這其中,尤以Linux基金會發起成立開源組織——超以太網聯盟UEC發展最為迅速,科技巨頭紛紛加入,讓UEC成為當下最熱門、發展最火熱的AI基礎設施相關組織。

挑戰谷歌!中國公司争奪AI網絡标準

最新消息顯示,在UEC最核心的技術委員會選舉中,阿裡雲成功入選,成為唯一的中國公司成員!這意味着,在下一代開放網絡的核心技術研發決策方面,首次出現中國科技公司身影,阿裡雲将連同微軟、Meta、AMD、博通等科技巨頭,一起參與核心決策及标準制定!

知情人士透露稱,UEC技術委員會成員席位競争十分激烈,隻有技術實力過硬、對開源社群貢獻大的成員才能通過選舉投票當選。阿裡巴巴是AMiner全球十大網絡研究機構中唯一的中國公司,阿裡雲也是開放網絡SONiC社群7個發起成員之一和技術委員會副主席機關。專家指出,此次入選UEC技術委員會,充分證明了中國網絡技術已經得到了業界同行的充分認可。

有消息透露,基于HPN7.0的大規模實踐,阿裡雲正牽頭推進面向AI需求的網絡性能提升項目等技術草案,而這一方向恰巧就是UEC對未來技術布局最重要的方向之一。

從落後到趕超,再到如今參與決策未來技術方向和标準制定,以阿裡雲為代表的中國科技公司,默默耕耘十餘年,才能在這個AI大時代的底層網絡基礎設施領域持續突破,讓中國方案打破壟斷,成為全球通用的開放技術标準,讓AI更好更快地服務于人類世界。

來源:觀察者網

繼續閱讀