
集微網消息,近日,雲豹智能與燧原科技達成戰略合作,依托雙方各自在DPU (Data Processing Unit) 和AI計算領域的軟硬體優勢,聯合開發大規模高性能AI算力平台,為雲端AI計算提供更高效的解決方案。
算力作為人工智能産業發展的三大要素之一,AI晶片是其載體。AI晶片作為人工智能産業的關鍵硬體,是AI加速伺服器中用于AI訓練與推理的核心計算引擎,被廣泛應用于人工智能、雲計算、資料中心、邊緣計算、移動終端等領域。目前,我國的AI晶片行業仍處于起步階段,市場空間有待探索與開拓。據艾瑞統計與預測,2020年我國AI晶片市場規模為197億元,到2025年,我國AI晶片市場規模将達到1385億元,2021-2025年的相關CAGR達47%,市場整體增速較快。
但對于很多企業來說,獨立建設自己的AI硬體叢集一次性投入和後續運維的成本非常高,建設周期長且使用率低。而AI算力雲化,以按需配置設定的方式提供AI算力,提高效能的同時,也可以降低成本。是以,AI算力雲化是未來AI發展的趨勢之一。
AI算力雲化不僅需要高性能的AI計算能力,也需要高性能的資料處理能力,包括AI晶片之間的資料通信,AI晶片擷取存儲資料等。随着AI資料爆發式增長,模型疊代速度更快,模型規模越來越大,資料處理能力的要求也越來越高。
AI晶片廠商、GPU廠商、AI算法開發商都在不斷探索硬體和軟體的解決方案。主流的GPU或AI晶片廠商提供自己私有的解決方案,比如NVIDIA的NVLink、GPUDirect和相應NCCL軟體,但AI市場和使用者期待着一個開放的技術和相應高性能解決方案。
目前,雲豹智能與燧原科技達成戰略合作,共同研發和提供大規模高性能AI算力平台解決方案。雙方創新性地提出了DataDirectPath技術:該技術用于高性能分布式資料通信,基于DPU的高靈活性和高性能的特點,實作與雲燧T20之間以及與存儲之間的高性能直接通信,提升AI訓練效率的同時,也降低了訓練成本。DataDirectPath包括:DataDirectPath RDMA和DataDirectPath Storage。DataDirectPath RDMA用于AI加速晶片之間的資料通信,而DataDirectPath Storage用于AI加速晶片與存儲器之間的高速資料讀寫。
雲豹智能與燧原科技合作,基于雲豹雲霄DPU和燧原科技雲燧T20率先推出了DataDirectPath Storage解決方案,為AI訓練儲存通路提供更高效的解決方案。在傳統解決方案中,雲燧T20通路存儲時,需要将資料先搬移到系統記憶體,再由系統記憶體搬移到目标裝置。在創新的DataDirectPath Storage解決方案中,基于DataDirectPath Storage技術,雲燧T20通過DPU直接獲得資料,進而繞過系統記憶體和CPU,讓資料通路速度更快,通路延遲更短,系統開銷更小。DataDirectPath Storage不僅支援資料通道的Bypass CPU, 也支援控制通道的Bypass CPU,讓控制路徑也更高效,大大降低CPU的開銷。
(校對/Andy)