天天看點

一線:智算中心是系統工程,還面臨十個挑戰

作者:通信産業報
一線:智算中心是系統工程,還面臨十個挑戰
構築AI時代的數字底座。

數字時代下,智算中心将會給行業帶來哪些影響?如何充分發揮智算中心的技術優勢,構築數字經濟算網新底座,助力産業數字化發展?

“我們相信不僅僅是算網融合,而是算網電能源融合才能建構可持續發展的數字經濟底座,國家算力一體化頂層設計才是破解進入智能社會的開門鑰匙。”鵬博士集團副總工程師、鵬博士研究院負責人侯興澤在接受《通信産業報》全媒體記者采訪時表示,不能隻着眼于算力中心單一環節,必須是系統工程,整體推進。

在侯興澤看來,智算中心是基于最新人工智能理論,采用領先的人工智能計算架構,專門為人工智能應用提供所需的算力服務、資料服務和算法服務的新型基礎設施。它旨在支撐資料開放共享、智能生态建設、産業創新聚集,促進AI産業化、産業AI化及政府治理智能化。

一線:智算中心是系統工程,還面臨十個挑戰

此外,液冷技術在智算中心中的應用更為普遍,以支援高功率密度的裝置并有效管理散熱問題。智算中心往往需要部署大量的高性能計算裝置,如GPU、TPU和FPGA等,這些裝置通常具有較高的功耗。是以,智算中心的單機櫃功率密度通常會高于傳統資料中心。根據調研,智算中心的單機櫃功率密度需要超過30kW,甚至達到100kW以上,而傳統資料中心的單機櫃功率密度一般在6kW~15kW之間。

侯興澤認為,智算中心是個複雜的系統工程,從各方面來看都處在積極演進過程中,随着主流廠商系統架構的快速演進疊代更新,不同建設時期的算力中心有很大不同。已經投産營運的第一代算力中心單機電源功率在6.5kw左右,單機可提供5P算力,普遍采用風冷散熱模式。到第二代算力中心單機電源功率提升至10.5kw,單機可以提供15P算力,開始出現氣液混合制冷散熱模式。到第三段算力中心單機電源功率可達24kw,單機可提供225P算力,普遍采用闆式液冷散熱模式。

可以預見,未來采用浸沒液冷的算力中心單機櫃功率密度達到60kw~240kw,單機算力超過1440P指日可待。第一第二代智算中心普遍進入營運期,第三代智算中心基本在建設階段,更新的智算中心還處于設計預研過程中。

目前,智能算力需求的快速增長讓智算中心的建設也進入了高速發展時期,各地也開始逐漸出台關于整體建設的指引以及相關名額,這主要還是為了引導智算中心向着“重品質”“綠色”的方向健康發展。

侯興澤指出,智算中心作為人工智能技術研發與應用的重要基礎設施,其發展面臨多方面的挑戰和難點。

第一,算力融合問題。智算中心需要提供通用算力和專用算力,以滿足自動駕駛、智慧醫療、智慧城市等不同場景的多元算力需求。單一化的算力方案難以兼顧多産業和多領域的特定需求。

第二,軟硬體協同不足。在智算中心的建設過程中,不同晶片平台、算法模型、資料庫和應用層面之間存在垂直一體化的“孤島”狀态,軟硬體相容性問題亟待改進。

第三,投資建設營運關聯問題。智算中心的投資、建設和營運往往由不同主體負責,可能導緻建設和營運割裂,影響客戶體驗和服務品質。

第四,能耗和碳排放問題。智算中心的裝置能耗和碳排放較高,AI模型訓練耗電量巨大,這對環境和成本控制構成挑戰。

第五,成本和價格規範問題。智算中心的建設和營運成本較高,部分智算中心的投資成本和使用成本超出正常市場價格,需要進一步規範和優化。

第六,應用場景豐富性和營運模式成熟度。智算中心在發展過程中需要更豐富的應用場景和成熟的營運模式,以實作其在各行各業的有效應用和商業化運作。

第七,開放性問題。智算中心需要解決開放性問題,以适應AI應用數量的增加和疊代速度的加快,確定能夠服務于更廣泛的領域和需求。

第八,技術瓶頸與優化方向。随着生成式AI和大模型的興起,智算中心需要不斷突破技術瓶頸,優化算力供給和算法支援,以滿足日益增長的算力需求。

第九,安全可信問題。智算中心的建設需要充分考慮資訊安全和産業安全,建構基于自主技術體系的安全可信環境。

第十,智算中心的網絡設計必須考慮到AI和大資料應用的特殊需求,提供高性能、低延遲時間、大帶寬、高穩定性、易擴充、易于管理和維護的網絡環境。智算中心在節點硬體、能源供應、制冷散熱、網絡互聯、開發環境、平台功能、持續營運方面都有更高要求,傳統資料中心難以滿足,是以需要定制化設計建設。

采寫:胡媛

圖表:曙念

編輯、校對:胡媛

指導:辛文

一線談:智算中心的挑戰與應對

智算中心産業圖譜:典型企業及競争力一覽

智算中心:"引燃"算力新基建(附産業圖譜)

政府工作報告首提“全國一體化算力體系”:為什麼?如何建?“東數西算”兩年:全國一體化算力網呼之欲出

專家解讀:如何建構全國一體化算力體系?

專家解讀:加快建構全國一體化算力網絡

一線:智算中心是系統工程,還面臨十個挑戰
一線:智算中心是系統工程,還面臨十個挑戰

繼續閱讀