天天看點

華為DataRobot HPDA存儲叢集解決方案釋出,加速HPC/大資料/AI創新

作者:華為資料存儲

11月8日,以“面向全應用,建構多雲時代可靠存儲底座”為主題的華為全聯接大會2022資料存儲峰會成功舉辦。峰會期間,華為DataRobot HPDA存儲叢集解決方案正式釋出,加速HPC/大資料/AI創新。

華為DataRobot HPDA存儲叢集解決方案釋出,加速HPC/大資料/AI創新

華為HPDA存儲叢集解決方案總監姜萬強

從HPC走向HPDA,高性能計算

已從計算密集型走向資料密集型

數字經濟時代,資料已成為新的核心生産要素,其重要戰略資源地位和核心科學決策作用已日漸凸顯。随着與大資料、AI等新的資料分析工具結合,HPC的訴求也從以數值計算為主,走向與大資料知識挖掘,及AI訓練推理結合的HPDA高性能資料分析時代,其發展挑戰展現在以下三個方面:

  • 一是海量資料大規模并發挑戰,資料呈現指數級增長,資料規模已經從之前的GB、TB、PB,上升到EB級甚至ZB級。爆炸式增長的資料,哺育了數字技術發展和應用,但很多新興業務也對高效資料處理提出了更高要求。
  • 二是多樣化應用實時分析需求,以一次完整的高性能基因組學分析流程為例,包含大資料預處理、高性能計算、AI仿真,其中涉及不同大小檔案處理、不同時延響應訴求;也涉及NFS、MPI-IO、HDFS及S3等多種協定的混合通路。一台分析裝置每年生産10PB資料HPC已從單域Silo數值計算到資料為核心的全流程資料分析,需要融合資料存儲資源池減少資料膨脹和遷移。
  • 三是跨域資料融合處理,在東數西算、東數西存的戰略牽引下,跨地域、跨叢集的資料共享與流動勢在必行,當面臨更複雜的資料量大、資料分散、資料多元化難題,急需找到科學的解決方案。

全棧協同、融合高效

華為DataRobot HPDA存儲

叢集解決方案正式釋出

華為DataRobot HPDA存儲叢集解決方案釋出,加速HPC/大資料/AI創新

為迎接高性能計算所面臨的全新挑戰,加速“HPC/大資料/AI”創新,華為正式釋出業界首個資料加速引擎加持HPDA全棧方案——華為DataRobot HPDA存儲叢集解決方案,并通過4個方面的創新以滿足海量資料高性能處理的訴求:

資料應用加速:使能資料加速,聯接應用與存儲,HPDA資料處理效率提升50%

華為DataRobot HPDA存儲叢集解決方案建構面向HPDA應用的資料加速引擎DataTurbo,聯接應用與存儲,使能HPDA應用極緻性能。

DataTurbo資料加速引擎由全局資料管理和應用加速引擎組成。其中應用加速引擎内置了自研網卡晶片和HPC、大資料加速套件,通過DataTurbo資料加速引擎應用加速能力、 OceanStor存儲的全局共享存儲能力,在面向E級超算場景下,實作萬級計算用戶端并發通路,且單叢集達到50TB/s帶寬,10億IOPS能力,性能領先業界30%。在面向實時分析的大資料場景下,實作百PB資料查詢10分鐘降至10秒。

資料跨域管理:全局資料視圖,跨域資料智能排程,效率提升3倍

姜萬強表示,“華為通過全局資料管理元件來消除資料孤島問題,讓資料看得見,調得動,流得快”。

一方面,基于統一進制資料,建構全局命名空間,可實作跨域資料統一通路,并支援智能的全文檢索,打破地域限制,讓資料看得見,并能發現資料價值與資源價格不比對的資料,如孤兒資料、備援資料、冷資料等,并根據需求對資料标簽化;

另一方面,華為還可以通過智能的排程政策,根據資料熱溫冷分級,提前把需要用到的資料進行緩存加速,實作3倍資料排程效率提升。

綠色節能:資料分級、整櫃節能,提升能效30%

在存儲系統設計上,通過熱溫冷資料智能分級設計,實作三個層級的資料自動流動:本地叢集内實作SSD、HDD主存儲、藍光存儲間的資料分級;跨叢集資料遠端自動分級到其他資料中心;本地資料中心到公有雲的資料分級流動。通過将資料放置在最合适的位置,實作跨資料中心層面的整體節能。

值得一提的是,基于華為DataRobot HPDA存儲叢集的自研多模型資料合并壓縮技術,可以将資料在本地壓縮後再傳輸,極大的節省傳輸帶寬和存儲空間,最終實作十年整體TCO降低70%。

面對傳統風冷機房的能耗問題與高密度支援問題,華為采用的風液冷機櫃,創新的硬體設計讓整櫃功率密度達到20KW+,PUE≤1.25,功率密度提升1.5倍。DataRobot HPDA存儲叢集所提供系列高密分布式存儲配置中,OeanStor高密大容量産品,在5U高的标準裝置空間内可以容量120塊HDD,機關空間密度比其他同類産品高出20%。

一站式傳遞快速上線,統一運維實作分鐘級問題定界

華為DataRobot HPDA存儲叢集方案提供了包含基礎櫃、計算櫃和存儲櫃在内的三類子產品化硬體組合,基于最佳實踐的典配機櫃設計,有不同規模業務場景可按需選擇部署、靈活擴充。基于其提供的一站式傳遞能力,可幫助使用者業務上線時間縮短50%,讓使用者更容易聚焦業務。

此外,方案還提供統一運維平台,能夠将多個資料中心的存儲、計算、網絡、容器等資源統一管理。面向資料中心建設,統一運維平台還提供從資源規劃、端到端資源發放、裝置運維,到資源優化全生命周期管理,相比傳統管理模式,能夠實作5倍的管理效率提升。同時,其提供的 AI智能運維能夠幫助企業實作分鐘級的問題定界,幫助企業實作運維管理無憂。

全棧靈活

加速“HPC/大資料/AI”創新

資料潛能的激發,有賴于資料的采集、存儲、計算、管理和應用,其中,作為資料采集後進行處理的第一道關口,資料存儲無疑是數字經濟最重要的“底盤”。從HPC走向HPDA的時代,華為DataRobot HPDA存儲叢集解決方案将以應用加速、跨域管理、綠色節能、全棧靈活,為千行百業的數字化轉型奠定堅實底座,加速HPC/大資料/AI創新,持續推動數字經濟的繁榮健康發展。

繼續閱讀