天天看點

三大營運商争相布局,全球掀起AI算力中心“軍備競賽”

作者:半導體産業縱橫
三大營運商争相布局,全球掀起AI算力中心“軍備競賽”

人工智能領域近年來正在迎來一場由生成式人工智能大模型引領的爆發式發展。2022年11月30日,OpenAI公司推出一款人工智能對話聊天機器人ChatGPT,其出色的自然語言生成能力引起了全世界範圍的廣泛關注,2個月突破1億使用者,國内外随即掀起了一場大模型浪潮,Gemini、文心一言、Copilot、LLaMA、SAM、SORA等各種大模型如雨後春筍般湧現,2022年也被譽為大模型元年。

人工智能也是以被視為革命性的技術,對世界各國政府具有重要的戰略意義。資料顯示,今年,大陸生成式人工智能的企業采用率已達15%,市場規模約為14.4萬億元。在制造業、零售業、電信行業和醫療健康等四大行業的生成式人工智能技術的采用率均取得較快增長。

作為推動人工智能發展的三大要素之一,算力被稱為人工智能的“發動機”和核心驅動力。算力是指裝置通過處理資料,實作特定結果輸出的計算能力。中國電信研究院戰略發展研究所進階分析師陳元謀表示,算力指數每提升一個點,對數字經濟的拉動大概是在0.36個百分點,對GDP的拉動大概是0.17個百分點

算力的緊缺甚至已成為制約人工智能研究和應用的關鍵因素。對此,美國對華高端算力産品采取了禁售措施,華為、龍芯、寒武紀、曙光、海光等企業都進入實體清單,它們晶片制造的先進工藝受限,國内可滿足規模量産的工藝節點落後國際先進水準2-3代,核心算力晶片的性能落後國際先進水準2-3代。

01

算力短缺催生算力中心巨大市場

21世紀,移動計算和雲計算蓬勃發展。雲計算的出現,使得算力可以像水和電一樣,通過網絡“流動”到需要它的每一個角落。

人工智能的崛起對算力提出了更高的要求,GPU(Graphics Processing Unit,圖形處理單元)和TPU(Tensor Processing Unit,張量處理單元)等專用硬體的出現,極大地提高了處理效率,為機器學習模型的訓練和推理提供了強大的支援。

疊加算力緊缺的因素,進一步促成和孕育了算力中心這樣一個巨大市場。算力中心是指具備高性能計算、大規模存儲、高速網絡等基礎設施的計算中心,旨在提供大規模、高效率、低成本的算力服務。

以國内為例,全國多地都在加速布局公共算力基礎設施。在上海,建設了全國首個算力交易平台和人工智能公共算力服務平台。在廣州,建設了國内首個算力資源釋出共享平台。可以說,這些公共平台給供需雙方牽了線搭了橋。

目前,國内在8個地區建設國家算力樞紐節點,并規劃了10個國家資料中心叢集,以建構國家算力網絡體系。截至2023年底,國内智算中心項目為128個,其中83個項目披露規模,規模總和超過7.7萬P。另外,2024年共有39個智算中心項目已投産。

02

智算缺口猶存,三大營運商布局智算中心

近兩年來,AI大模型層出不窮,對智算的需求也在飛速增長。市場咨詢機構IDC預計,2026年,大陸智能算力規模将進入每秒十萬億億次浮點(ZFLOPS)級别,達到1271.4EFLOPS。此前六部門釋出的《算力基礎設施高品質發展行動計劃》明确了頂層算力在未來三年的建設節奏。其中提及,2023年至2024年智算建設缺口為23EFlops。2025年全國算力目标超過300EFlops,智算比例達到35%,智算算力目标為105EFlops。

針對于此,近年來三大營運商也在積極布局智算中心,并提出相關戰略部署。

中國聯通在提供專業化智算基礎設施服務方面,布局了“1+N+X”智算能力體系,包括了1個超大規模的單體智算中心、N個智算訓推一體樞紐和屬地化的X個智算推理節點。

中國移動強化“4+N+31+X”資料中心布局,圍繞熱點、中心、邊緣實作算力資源覆寫,建設邊緣節點超1000個。“4+N+31+X”資料中心體系,其中“4”指京津冀、長三角、粵港澳大灣區、成渝等4個熱點業務區域,“N”指國家樞紐節點10 個資料中心叢集内規劃的超大型資料中心;“31”指各省規劃超大型資料中心;“X”指各地市級資料中心及彙聚機房。

中國電信則提出了“雲網融合”的理念,形成了“2+4+31+X+O”的算力布局。其具體特指在内蒙古和貴州兩個全國性雲基地打造融合資源池,在京津冀等4個大區建成大規模公有雲;在31個省省會級和重點城市建設屬地化專屬雲;在X節點打造差異化邊緣雲;布局“一帶一路”沿線國家,将算力體系延展至海外。

03

美歐日大舉投資,全球掀起AI算力 “軍備競賽”

目前,全球範圍内的各國都在制定各自的人工智能戰略和政策,以推動 AI 産業發展。

美國在 2016 年釋出的《美國人工智能研究和發展戰略計劃》中就明确提出了加強 AI 基礎設施的建設。同時,歐洲聯盟也在 2018 年釋出的 AI 戰略中明确提出了加強基礎設施建設的目标。這些基礎設施主要包括計算資源、資料資源、人才資源等。日本緊跟美國步伐,相繼于2019年、2021年、2022年出台3版《人工智能戰略》。去年四月,日本政府成立人工智能戰略小組,由首相輔佐官村井英樹擔任組長,組員包括内閣官房、外務省、數字廳等部門人工智能政策主管官員。

在一系列戰略部署下,美日歐等國家和地區也在争相建設算力中心,全球掀起AI算力“軍備競賽”。

去年11月,美國國家超級計算中心和諸多AI領域龍頭公司聯合組建了萬億參數聯盟(TPC)。該聯盟由來自全球的科學家組成,目标是共同推進用于科學發現的AI模型,特别關注一萬億或更多參數的巨型模型。目前,TPC正在開發可擴充模型架構和訓練政策,并組織整理用于模型訓練的科學資料,以優化目前和未來的百萬兆次級計算平台的AI庫。

此外,美國能源部下屬的橡樹嶺國家實驗室、勞倫斯·利弗莫爾國家實驗室以及 IBM、NVIDIA公司成立超級計算機卓越實驗中心,聯合開發新一代 HPC 計算機,使用 IBM 的Power 處理器及 NVIDIA 的 Teslak 加速卡,浮點性能至少 10 億億次,最高的可達 30 億億次。

2020年12月,歐盟拟為“數字歐洲”計劃撥付75億歐元,其中22億歐元用于超級計算,21億歐元用于人工智能。該計劃具體包括:在2021年底前至少收購1台百萬兆級超級計算機;在健康、制造和能源等領域建立可用于人工智能的全歐資料空間及測試設施;部署泛歐量子通信基礎架構并支援建立網絡安全産品認證計劃;專設人工智能、進階計算和網絡安全碩士計劃等。

去年3月,英國政府承諾向超級計算和人工智能研究投入10億英鎊(13億美元),希望成為“科技超級大國”。作為該戰略的一部分,政府表示,希望花費約9億英鎊建造一台“超大規模” 計算機,它能夠建構自己的“BritGPT”,與OpenAI的生成式AI聊天機器人相媲美。

今年四月,日本經濟産業省将向5家日本企業提供總額725億日元的補貼,用于打造人工智能超級計算機,旨在減少對美國的技術依賴。日本政府為Sakura Internet、日本電信巨頭 KDDI、GMO 網際網路、Rutilea 和 Highreso 分别提供 501 億、102 億、19 億、25 億和 77 億日元的政府補貼。消息顯示,日本“産業技術綜合研究所”将最早于今年開發出一台超級計算機,其計算能力大約是現有機器的 2.5 倍。在日本經産省的監督下,該機構将通過雲服務将這台超算提供給開發生成式 AI 的日本國内企業。

除了政府支援的項目外,全球科技企業也在砸錢建算力。亞馬遜計劃未來15年投資 1480 億美元在全球各地建設資料中心,滿足人工智能等需求。谷歌公司宣布投資 30 億美元用于建設或擴建位于弗吉尼亞州和印第安納州的資料中心園區。微軟、OpenAI也正在進行一項分為五個階段的超級計算機建設項目,拟動用的投資将超過1150億美元,其中大部分的成本将用在采購驅動AI所需的算力設施。

04

營運商啟動大規模采購,AI晶片市場爆發

大規模的布局算力中心也帶來了對AI晶片的大規模采購。

近日,中國移動啟動大規模AI晶片集采引發業界廣泛關注。中國移動啟動2024年至2025年新型智算中心采購。招标公告顯示,本次項目采購總規模達到8054台。有機構測算,按照此前中标報價,此次采購規模或超過150億元。

一個月前,中國聯通也啟動了超過2500台AI伺服器采購,而中國電信此前也早已行動。随着三大營運商啟動大規模招标,在業内看來,國内算力部署已經駛上“快車道”。

就在2個月前,中國移動還釋出了2023年至2024年新型智算中心(試驗網)集采項目,12個标包對應AI訓練伺服器采購量總計達到2454台(1-11标包集采1204台,12标包集采1250台)。

在3月底,中國聯通釋出2024年中國聯通人工智能伺服器集中采購項目資格預審公告,公告顯示,2024年中國聯通人工智能伺服器集中采購項目已準許,招标人為中國聯合網絡通信有限公司及省分公司、聯通數字科技有限公司等。此次中國聯通将采購人工智能伺服器合計2503台,關鍵組網裝置RoCE交換機合計688台,本次采購不劃分标包。

去年10月,中國電信也公布了AI算力伺服器(2023-2024年)集中采購項目評審結果,超聚變、浪潮、新華三等廠商入圍,合計采購4175台AI伺服器和1182台交換機。

05

算力中心建設帶動AI晶片廠商受益

目前來看,主要有建設算力中心的企業包括營運商、大型雲服務企業和大型網際網路企業。這些企業資金充沛,體量大,能承擔建設算力中心的巨額費用。同時,其對算力需求巨大,也有豐富的下遊客戶可以出售算力。

2023 年 10 月 17 日,美國商務部出台了出口管制清單的 ECNN 3A090 和 4A090 要求,以進一步限制高性能 AI 晶片的出口,同時将 13家中國公司列入實體清單。修改後的出國管制設計 産品包括但不限于:英偉達 A100、A800、H100、H800、L40、L40S 以及 RTX 4090 産品。由于美國對國内算力AI晶片的采購限制。目前算力中心和相關AI晶片已形成國内外兩個市場。

國内巨大的算力市場帶動了國産晶片廠商受益。近日,中國移動正式宣布建成全球營運商最大單體智算中心——中國移動智算中心(呼和浩特),目前已投産使用。該智算中心項目部署約2萬張AI加速卡,AI晶片國産化率超85%。

中國聯通近日也在北京建成了全國首個“政府+營運商”智算中心,算力中心繼續沿用全國産化的昇騰AI基礎軟硬體。

此前,中國電信上海公司在上海點亮的“大規模算力叢集暨人工智能公共算力服務平台”,是全國規模最大的營運商級智算中心,算力叢集規模達15000卡,采用自主創新AI晶片。年初投入營運的中國電信中部智算中心也采用了基于國産AI基礎軟硬體平台的方案架構。

不難發現,國内算力中心多采用國産AI軟硬體。目前GPU在AI晶片市場用量最大,目前國産AI晶片采購主要受益中國代表企業包括華為、海光資訊、景嘉微、燧原科技等。去年百度為200台伺服器便訂購了1600片昇騰910B AI晶片。

據機構測算,受英偉達限令更新影響,2024年AI國産晶片新增市場空間将達到700億以上。

國外其他主要市場在晶片采購方面收到的限制較小。全球AI晶片市場目前基本被以英偉達為代表的歐美大廠主導,業界資料顯示,英偉達以80%的市占率幾乎“壟斷”AI晶片市場。此前英偉達的CEO黃仁勳還宣布,他們将在日本建立AI工廠,并且該工廠優先供應日本本土的GPU需求。

06

競争加劇,大廠開始自研AI伺服器晶片

目前普遍認為,人工智能熱潮下,受益最多的是“賣鏟子”的AI晶片廠商。資料顯示,晶片成本在基礎型伺服器中約占總成本的32%,而在高性能或更強性能的伺服器中,晶片成本占比高達 50%~83%。

過高的成本也導緻有越來越多的網際網路和IT裝置大廠開始自研AI伺服器晶片。

2016年,谷歌推出了自研的AI張量處理單元(TPU),2022年前後,谷歌開始研發基于Arm架構的伺服器CPU,2024年4月,谷歌釋出了自研Arm構架CPU——Axion,并宣布該晶片已經在内部使用。

2020年,微軟開始為其Azure雲服務定制晶片,2023年11月,微軟推出了兩款自研晶片——Maia100和Cobalt100。Maia100是一款專為大語言模型訓練和推理而設計的晶片,采用台積電5nm制程,Cobalt100是一款基于Arm架構的128核伺服器CPU。

今年4月初,Meta釋出了新一代AI訓練和推理加速器MTIA,其計算和記憶體帶寬是上一代産品的兩倍多,最新版本晶片有助于驅動Facebook和Instagram上的排名和推薦廣告模型。

此前,有報道稱,美國AI研究公司OpenAI正在與包括阿聯酋政府在内的潛在投資者進行談判,試圖推動一個旨在提高全球晶片制造能力的項目,重塑全球半導體行業。其中一名知情人士透露,該計劃準備籌集高達5萬億至7萬億美元。

此外國内大廠也不逞多讓,開始研發AI晶片。近日,中國移動在其2024算力網絡大會上正式釋出大雲磐石DPU,該晶片帶寬達到400Gbps,為國内領先水準。