天天看點

DPU挺進資料中心,NVIDIA開啟雲原生超級計算時代

DPU挺進資料中心,NVIDIA開啟雲原生超級計算時代

作為資訊社會的數字底座,資料中心已經成為推動社會發展的戰略性基礎設施。如今,完全基于零信任的大環境下,資料中心既要有無限算力,又需要高安全性能。“要應對這樣的環境,目前最好的技術就是雲原生技術。”NVIDIA網絡事業部宋慶春表示。

會計算的Quantum-2平台

上個月初,NVIDIA釋出了新一代 InfiniBand 網絡平台—— NVIDIA Quantum-2平台 。據介紹,NVIDIA Quantum-2将為雲計算提供商和超級計算中心提供極緻的性能、廣泛的接入能力及強大的安全性。

“Quantum-2平台的推出是基于現在的資料和計算量爆發性增長的現狀。 ”宋慶春表示,“傳統方式對于雲服務的需求主要是靈活便捷,但是當需要大的算力資源時,往往需要利用超算中心的資源。如何把超算的性能和雲的靈活性、安全性整合起來提供一種更新的架構支援現有的不斷增長的算力業務需求?”宋慶春強調:“需要通過雲原生超算技術把超級計算技術帶入資料中心中,讓資料中心擁有了超算技術的同時,也兼具靈活性和安全性。雲原生将會是未來提供算力平台的發展趨勢。”

據介紹,NVIDIA Quantum-2平台即400Gbps的InfiniBand網絡平台,包括NVIDIA Quantum-2交換機、ConnectX-7網卡、BlueField-3 InfiniBand DPU(資料處理器)和所有支援這種新架構的軟體。憑借其雲原生技術,NVIDIA Quantum-2提供每秒 400Gb/s 的高吞吐量和先進的多租戶支援功能,能夠滿足衆多使用者的需求。

DPU挺進資料中心,NVIDIA開啟雲原生超級計算時代

據悉,當超級計算機和雲原生超算系統要實作高性能時,需要所有的資源都參與到計算裡面來。Quantum-2的目标是實作資料在哪裡,計算就在那裡。基于上述優勢,Quantum-2可以幫助企業實作對AI業務一個至關重要的技術——網絡計算技術(In-Network Computing)。

NVIDIA 網絡事業部進階副總裁 Gilad Shainer曾表示:“如今,超級計算中心和公有雲的訴求正在走向融合 —— 它們必須為新一代高新能計算(HPC)、AI 和資料分析的應用提供盡可能高的性能,同時還應安全隔離應用,并響應使用者對流量的不同需求。憑借 NVIDIA Quantum-2 InfiniBand 平台,現代資料中心已經可以将這一遠景變為現實。”

3U一體賦能無限算力

伴随着計算力的提升,尤其是異構計算的發展,近些年,GPU加速計算成為了人工智能、深度學習和大資料分析應用的關鍵。大資料時代,資訊和資料呈現爆發式增長的趨勢,DPU成為資料中心加速計算模型中繼CPU、GPU之外的的第三個計算單元。

在NVIDIA GTC 2021峰會上,NVIDIA正式釋出了新一代資料處理器NVIDIA BlueField-3 DPU,為資料中心提供強大的軟體定義網絡、存儲和網絡安全加速功能。NVIDIA的BlueField DPU為3U一體架構奠定了基礎。

據介紹,使用BlueField DPU後,可以将所有的CPU資源用于運作業務應用程式,不再需要部分CPU資源來支援SDN。除此之外,還能夠使擴充能力提升,雲原生應用程式是高度分布式的應用程式,帶來資料中心内密集的“東西向”流量,BlueField DPU 可為擴充應用程式提供高吞吐量、低延遲的網絡環境。

另外,雲資料中心的多租戶和基礎設施彈性會帶來隐私和機密性風險,而 BlueField DPU可很好地應對這些風險。BlueField DPU還可提供穩健而強大的網絡,用于應對 GPU 加速計算在雲、企業和邊緣領域中不斷增強的廣泛應用的需求。

宋慶春表示:“DPU的出現彌補了資料中心中基礎設施加速能力不足的問題,實作了DPU、GPU、CPU 3U一體新型資料中心架構,讓資料中心成為新的計算單元。給了我們一個優化算力資源時,從資料中心這種更高層次、更高粒度、更大空間裡來進行優化的一個思考空間,3U一體已經成為資料中心的一個必然的架構。”

零信任挑戰

目前,企業面臨着資料量越來越大,資料傳輸速度越來越快。各種異構資料頻繁出現,非結構化資料的量遠遠大于結構化資料,在處理非結構化資料時,複雜程度會遠遠大于處理結構化資料。再加上需要做跨平台的整合,各種模型疊代、計算疊代、平台疊代越來越快,網絡安全已經成為資料安全的最大的威脅。

DPU挺進資料中心,NVIDIA開啟雲原生超級計算時代

如何解決此問題呢?為助力企業應對日漸複雜的威脅,NVIDIA 釋出了一款零信任網絡安全平台。利用該平台的一整套功能,網絡安全行業可建構實時保護企業資料中心的解決方案。零信任安全平台結合了三種技術 —— NVIDIA BlueField DPU、NVIDIA DOCA 和 NVIDIA Morpheus 網絡安全人工智能架構。

據介紹,NVIDIA DOCA 1.2是專門面向零信任安全架構的SDK,在DOCA1.2中提供了面向Load Balancers、DPI、 IPS、IDS、下一代防火牆等安全業務的API,設計安全軟體的使用者或者安全軟體的供應商,可以直接通過DOCA API調用在DPU裡的硬體加速引擎,讓資料中心更安全。

此外,NVIDIA Morpheus 是NVIDIA在DPU+DOCA安全資料中心裡的一個深度學習網絡安全架構。最新版本包括一個新的工作流程,該工作流程使用無監督學習來建立數字指紋,以檢測網絡入侵者何時接管使用者帳戶或機器。NVIDIA Morpheus可加速資料科學處理、通過NVIDIA AI 訓練生成預訓練模型或推理模型,并将新的Policy下發給NVIDIA DPU,使企業能夠同時檢查其資料中心網絡中的所有遙測資料。

宋慶春指出:“資料中心對算力的需求變得越來越大,大規模的模型層出不窮,要運作大的模型需要很多的GPU來并行處理,資料并行和模型并行在未來工作訓練中同時使用将成為一個趨勢。在這種大規模使用場景下面,如何既保持很高的算力,又能夠在多租戶情況下保證訓練性能,保證業務的安全性?雲原生技術對這樣一個趨勢是必不可少的。”

繼續閱讀