天天看點

資料中心的三個時代:開放網絡如何使其自動化

從實體伺服器到虛拟化系統,現在資料中心又發展成可組合的基礎架構。在這種基礎架構中,像存儲和持久記憶體之類的資源已從伺服器中分離出來,原先的資料處理和聯網任務隻在CPU上運作,現在演變為可在GPU、DPU或FPGA上運作計算。另外,軟體開發模型從單台計算機上運作的程式,演變為在整個資料中心上運作的分布式代碼,實作了雲原生、容器化的微服務。

在新一代的資料中心裡,開發人員可以通過一個可程式設計的資料中心結構來組裝各種類型的處理器和資源,組成自己所需要的雲計算平台。

資料中心的第一個時代是以CPU為中心的,即隻能在一台計算機上運作一個應用程式。由于資源配置設定是靜态的,并且更換伺服器可能要花費數周或數月,是以通常需要多台伺服器,而且還不能得到充分利用。

資料中心的三個時代:開放網絡如何使其自動化

資料中心的第二個時代,虛拟化成為了一種标準,每台伺服器上可運作多個虛拟機。資源是動态的,VM是按需建立的。當需要更多的CPU、記憶體或存儲時,可以将工作負載遷移到其他伺服器上的VM。

處理仍然由CPU執行,GPU或FPGA偶爾會加速特定任務。應用程式開發人員依然是一次隻在一台計算機上編寫CPU程式。第二代的資料中心仍以CPU為中心。

資料中心的三個時代:開放網絡如何使其自動化

01

資料中心新時代

現在,我們進入了資料中心的第三個時代,我們稱之為ADI(Accelerated Disaggregated Infrastructure),它基于可組合的基礎架構,微服務和特定域處理器。

ADI有以下特點:

加速:不同的處理器可以根據最優方案加速不同的工作負載。CPU運作通用的單線程工作負載,GPU運作并行處理工作負載,資料處理單元(DPU)管理資料的處理和低延遲移動,使CPU和GPU更有效地獲得所需的資料。例如,CPU可以運作資料庫,GPU可以處理人工智能和視訊,而DPU可以快速,高效,安全地将正确的資料傳遞到需要的地方。

使用GPU加速的AI和機器學習現在無處不在:線上購物、5G無線、醫學研究、網絡安全、軟體開發、視訊處理乃至資料中心營運。可以通過DPU加快網絡、存儲通路和保證安全性來使雲和容器快速增長。

解耦:将計算、記憶體、存儲和其他資源分成多個池,并以适當的數量動态配置設定給伺服器和應用程式。通常,應用程式本身是由互動微服務建構的,而不是作為一個整體的代碼塊。這樣可以更輕松地以正确的資源比例編寫應用程式,并根據需要更改該比例。

使用ADI模型,GPU,DPU和存儲可根據需要連接配接到任何伺服器、應用程式或VM。通過使用Nvidia的GPU Direct和Magnum IO等技術,CPU和GPU可以在網絡上互相通路和存儲,其性能幾乎都與同一台伺服器上的相同,可以将正确數量和類型的GPU配置設定給需要它們的工作負載。每台伺服器中的DPU可以管理和加速常見的網絡、存儲、安全性、壓縮和深度資料包檢查任務,以保持資料的快速和安全移動且不會給CPU或GPU造成負擔。

資料中心的三個時代:開放網絡如何使其自動化

通過ADI,資料中心成為了新的計算單元,并且完全可組合,由GPU和DPU加速。

02

要對資料中心進行程式設計,必須對網絡進行程式設計

對于ADI,資料中心是新的計算單元,而網絡結構提供了一個靈活、自動化、可程式設計的架構來動态地組合工作負載資源。這意味着不僅要對CPU、GPU和DPU進行程式設計,還要對網絡結構本身進行程式設計,将DevOps的優勢擴充到網絡中,這種方法稱為“基礎架構即代碼”(Infrastructure as Code,IaC)。

該結構必須可程式設計、可伸縮、快速、開放、功能豐富、自動化友好且安全。它可以在CPU,GPU和存儲之間提供多種高帶寬路徑,并能夠對流量類别進行優先級排序。

資料中心的三個時代:開放網絡如何使其自動化

使用ADI,每個應用程式都可以在由CPU,GPU和存儲資源組成的虛拟伺服器上運作,而DPU可以加快通路和提高安全性。

03

開放式網絡作業系統支援ADI

傳統上,交換機被設計為專有的“黑匣子”,其中網絡作業系統(NOS)鎖定在特定的交換機硬體平台上,要求客戶一起購買和部署它們。

以Nvidia為例,其方法是提供最佳的開放式端到端解決方案。客戶可以采用最佳的交換機ASIC,并根據自己的需要選擇最好的NOS:Cumulus Linux、Mellanox Onyx、SONiC等。客戶甚至可以選擇在Spine Switches上運作SONiC,而在機架式交換機和園區交換機上使用Cumulus Linux。

資料中心的三個時代:開放網絡如何使其自動化

與專有的封閉式交換機模型不同,開放式網絡使客戶可以從同類最佳的軟體和硬體中進行選擇,以獲得所需的功能和性能,并提高可管理性。

現在,企業、AI、雲和HPC工作負載可以使用包括GPU、CPU、DPU、記憶體、存儲和高速連接配接在内的最佳資源,在整個資料中心的任何部分靈活運作。

原文連結:

https://www.nextplatform.com/2020/08/04/datacenter-is-the-new-unit-of-compute-open-networking-is-how-to-automate-it/