天天看點

中國移動憑何一統算力江湖?

作者:白犀牛通信
中國移動憑何一統算力江湖?

中國移動确實是有野心的。

與其他雲廠商或埋頭發展技術,或在市場側搞些小動作不一樣,中國移動上來就是高舉高打,站在平衡國家算力供需、推動國家整體算力發展的角度,提出了“算力網絡”這一全新的算力供給方式。

不得不說,從規劃理念上看,算力網絡絕對是劃時代的設計,它把算力的供給方式從原來單一集中的算力資源池承載向多樣化的算力資源承載方式發展。

理論上,一張算力網絡可以把社會上所有的算力資源連接配接起來,包括集中化的超級計算中心、泛分布的邊緣/端算力節點,也包括超算、智算和社會算力等多樣化的異構算力,算力網絡将成為與水電一樣,可“一點接入、即取即用”的社會級服務。

簡單來說,中國移動想要通過算力網絡來一統算力的江湖!這有中國移動轉型發展的“私心”,也有打造社會級算力服務體系、提高算力使用率、支撐數字經濟發展的“公義”。

- 01 -

但是,理想很美好,要實作它,卻面臨着巨大的挑戰,比如,算力網絡化後,如何實作高效準确的排程?這就需要到本文的主角——算網大腦。

算網大腦,顧名思義,就是算力網絡的大腦,作為算力網絡的中樞排程決策系統,為新型資訊基礎設施對外一體化服務提供能力支撐。

算網大腦主要用以解決以下幾方面的問題:

第一,目前現有的、各廠家各自獨立的雲和網編排排程系統無法滿足複雜的算網融合業務的管理需求,需要一個跨算網各域的、智能化的系統來實作靈活高效的算網統一編排排程。

第二,目前算力形态多樣,超算、智算、雲、邊、端等等,算力網絡需要實作跨越實體分布、雲邊端分層協同和異構融合的算力資源統一排程,同時,在網絡層面,需要通過算、網一體化編排管理實作網随算動、以網強算。

第三,算力網絡包含的資源類别和資源數量規模龐大,呈現高度的複雜性。傳統的資料采集、編排排程、運維方式已無法滿足這種高度複雜性的算力網絡的需求。算網編排管理需要提高算網感覺、編排和運維的自動化和智能化水準,實作面向算力網絡的資料智能感覺、算網智能編排、智能運維。

第四,目前,算力域和網絡域有着各自特有的資料感覺體系,并且長時間獨立發展,自成一派,暫未打通融合。算力網絡缺少統一、全局性的算、網狀态實時采集、感覺、呈現能力;亟需建構算網感覺能力,逐漸融合、統一現有的算、網感覺體系,制定算網一體化感覺模型體系。

第五,算網多要素融合編排和協同排程控制依賴于對于底層基礎設施的能力抽象和模型化,需要建構一體統一的算網排程機制,并促進算網基礎設施具備自身獨立編排能力及跨域協同編排能力,且能夠對外提供标準化封裝、可自動執行的原子能力和服務。

簡單來說,算網大腦需要提供的是算力供給能力、資料處理能力、網絡連通能力、業務供給能力,并實作以上能力組合的最大化。

- 02 -

我們必須承認,中國移動的規劃能力和執行能力都是超一流的。

2021年提出算力網絡後,随即啟動了算網大腦的建設,算網大腦是IT和CT兩大體系融合的關鍵,也是對中國移動研發、試驗、組織和變革能力的考驗。

按照中國移動的定位,算網大腦作為整個算力網絡體系的“智能中樞”,是算力網絡編排管理層核心,是算網共生發展的關鍵系統。

中國移動憑何一統算力江湖?

在橫向上,算網大腦對算網資源、算力服務以及算網應用等算力網絡各層的多種原子能力進行抽象、封裝,通過按需、靈活的組合方式及規則,形成可以由上一層調用的産品化和子產品化的服務;

縱向上,實作從資源、服務到應用的自下而上的統一協同編排,按需組織各層能力,實作算網各層原子能力效能的最大化。算網大腦面向算網基礎設施層實作算網全領域資源拉通,面向算網營運服務層實作算網融合類全業務支撐,并融合人工智能技術提升産品設計、編排排程、運維優化等方面的智能化能力。

一個典型的算網大腦業務流程如下圖所示:

中國移動憑何一統算力江湖?

0.算網感覺中心持續感覺算力網絡基礎設施層的各類算力、網絡等資訊,并向算網智慧中心提供用于智能分析的算網資料。

1.算網大腦能力開放中心接收來自算網營運層的算網業務訂單。

2.算網大腦能力開放中心分解業務需求,如果是非算網業務的訂單轉給其他系統處理,如果是算網業務需求則發送給算網編排中心。

3.算網編排中心從算網感覺中心擷取算網資源資訊和狀态,擷取備選資源資料。

4.算網編排中心通過算網智慧中心根據業務政策和備選資源資料進行智能分析決策,選中該算網業務訂單的算網資源。

5.算網編排中心根據業務模闆對算、網資源進行組合編排形成滿足訂單需求的算網業務資源組合的執行個體。

6.算網編排中心通過算網排程中心完成對算網業務執行個體中所有算、網資源的排程和配置,使能底層基礎設施。

7.算網排程中心在完成了對于基礎設施層的資源的排程和配置後,向算網編排中心傳回結果。

8.算網編排中心根據訂單完成算網業務的開通,通過算網大腦能力開放中心向算網營運層回報訂單處理結果及算網業務開通的資訊。

- 03 -

明确定位後,中國移動開始了密鑼緊鼓的建設工作,制定了“1+2+N”的算網大腦研發推進方案,基于算力網絡整體規劃和業務需求,系統性開展算網大腦研發頂層設計,明确算網大腦系統架構、子產品分工和演進方案。

中國移動憑何一統算力江湖?

中國移動組建了兩支研發團隊開展算網大腦的研發,即“天穹隊”和“星辰隊”。其中,“天穹隊”由網絡事業部牽頭,團隊成員包括研究院開發團隊、資訊技術公司IT雲支撐團隊、設計院開發團隊、浙江公司;“星辰隊”由雲能力中心牽頭,團隊成員包括政企事業部、資訊技術公司雲開發團隊、網絡事業部雲專網團隊、浙江公司。

兩個團隊依托各自的需求、資源和研發能力,面向需求與場景、網絡能力封裝與開放、多要素編排、多主體編排、任務式服務等五個方向開展攻關,先行先試探索,形成閉環,研發過程中實作能力互補和成果共享,互相提供移動雲和網絡能力開放的支援。

- 04 -

經過近兩年的努力,到今天,中國移動算網大腦無論從理論研究,還是落地實踐,都走在了行業前列!

今年科技部啟動國家超算網際網路部署工作,要求将全國衆多超算中心通過算力網絡連接配接起來,建構一體化算力服務平台。基于國家算力互聯互通的要求,結合國内算力不斷增長且使用率低的現狀,中國移動基于轉售雲、合營雲的整合經驗,通過移動雲統一門戶,推出算力并網方案。

同時,今年4月中國移動推出了業界首個運用人工智能技術實作自動化運維的“算網大腦”M-Robot,打造智能、感覺、編排、排程等能力,實作算領域、網領域的營運貫通、資源互調,實作全網跨域、跨廠商的算力流動,滿足“東視西渲”、“雲遊戲”等一體化、任務式服務。目前,移動雲已基于算網大腦建構了四大典型應用場景,即東數西算類、強算AI類、任務渲染類、泛視訊類。

截至目前移動雲已并網華為、曙光等10餘個雲平台,并網對象覆寫了通用算力、超算、智算、新型算力(如量子計算等)全部類型,算力規模達到9.5EFLOPS,初步實作全國多地算力互通。

按照這個方向走下去,中國移動算力網絡一統算力江湖,并不遙遠。

注:本文部分内容引用自中國移動《算力大腦白皮書》。

- END -

繼續閱讀