天天看點

分布式資料中心網絡互聯技術實作

作者:運維法拉令

01虛拟機跨中心動态遷移

最常見的分布式資料中心應用場景是基于“動态虛拟機遷移技術”的跨中心計算資源調配,如Vmware ESXi産品的vMotion技術可以在不中斷虛機運作狀态的情況下,将虛機從一個實體伺服器遷移到另一個實體伺服器。vMotion的核心技術是虛拟機記憶體及CPU運作狀态在不同實體機之間的拷貝,而遷移前後的兩台實體機需要通過“共享存儲(Shared Storage)方式”或“雙活存儲(Active-Active)方式”共享相同的虛機映像檔案。

對于采用NAS技術實作的共享存儲,兩台實體機必須能通路到相同盤陣上的目标檔案;對于采用SAN擴充技術實作的共享存儲,兩台實體機需要通路具有相同LUN ID的儲存設備。共享存儲方式的資料中心存儲網絡互聯方案如圖1左側拓撲,儲存設備隻部署在A中心,NAS或SAN跨A、B中心部署,當虛機從A中心遷至B中心時,B中心的實體伺服器仍然可以通路位于A中心的儲存設備。

挑戰1:

解決存儲對延時敏感

跨中心做虛機遷移的第一個技術挑戰是存儲對延時敏感,B中心對存儲的通路延時較大,随着兩中心間的距離增大,遷至B中心的虛機I/O性能随之下降。采用雙活(Active/Active)方式的存儲技術(如EMC VELEX Metro)可以較好的解決共享存儲方案的通路延遲問題。如圖1右側拓撲,在A、B中心都同時部署實體儲存設備,并且通過SAN互聯,由位于A、B中心的存儲控制器在A、B中心間虛拟出一個邏輯儲存設備,兩中心的實體伺服器通路具有相同LUN ID的邏輯儲存設備,存儲控制器實作讀I/O請求的就近通路以及寫I/O的雙側同步。

是以,當A中心的虛機遷至B中心時,B中心的伺服器通過本地的存儲控制器通路本地的儲存設備,是以該方案的I/O延遲比共享存儲方式小。FC SAN互聯通常借助傳輸技術(DWDM、SDH等)實作,也有基于IP技術的FCIP互聯方案,但FCIP在實際部署中不多見。iSCSI SAN互聯及NAS網絡互聯都基于TCP/IP技術實作。

分布式資料中心網絡互聯技術實作

圖1. 分布式資料中心的存儲網際網路絡

挑戰2:

保持遷移前的運作狀态

跨中心做虛機遷移面對的第二個挑戰是虛拟機完成vMotion之後,不僅IP位址不變,而且還保持遷移前的運作狀态(如TCP會話狀态),是以必須将涉及虛機遷移的實體伺服器接入同一個二層網絡,以便在虛機遷移之後仍然可以通路位于同一網段内的其他虛機(或伺服器),是以這種應用場景要求建構跨中心的二層網際網路絡。

MAC over IP(如H3C EVI技術)。通過在IP網絡上動态建構隧道,實作以太網VLAN的跨資料中心部署。這種技術不依賴實體層技術和資料鍊路層技術,隻要網絡層IP可達,則VLAN就可順勢擴充。另外, EVI技術針對分布式中心應用場景進行了一些優化了設計,例如EVI實作了“網關分離部署特性”、“基于控制協定學習MAC位址”、“ARP代理特性”等,是以推薦使用該技術實作資料中心二層互聯。

VPLS。一種傳統的二層VPN技術,營運商通常用該技術為客戶提供多站點二層互通。VPLS主要是基于MPLS技術實作,且在各站點間通過廣播來學習MAC位址,其配置管理較複雜,是以通常情況不建議采用該技術實作資料中心間二層擴充。

DWDM/Dark Fiber。在實體媒體層實作資料中心間互聯,可以為跨中心二層擴充提供靈活的部署形式,例如,使用者既可以直接将兩中心的交換機互聯實作VAN擴充,也可以先在資料中心間建立三層互聯通道,再基于MAC Over IP(如H3C EVI技術)技術實作VLAN擴充,後者的好處在于可以利用MAC Over IP提供了技術特性簡化分布式資料中心間MAC位址學習、三層路徑優化等問題。

挑戰3:

解決三層次優路徑

跨中心做虛拟機遷移的第三個技術挑戰是虛機完成動态遷移之後的三層通路路徑問題,如圖2左側拓撲,虛拟機位于A中心,其IP位址是10.1.1.100。按照傳統的部署思路,為保證客戶機可以通路位于A中心的虛拟機,必須在網絡三層轉發的Ingress方向和Egress方向上做如下部署:

Ingress方向(客戶機到虛機):B中心的核心路由器向客戶機方向通告虛機所在子網的路由(如10.1.10/24),而A資料中心的核心路由器将虛機所在的子網位址拆分成兩條掩碼更長的路由(10.1.1.0/25和10.1.1.128/25)向客戶機方向通告,由此客戶機到虛拟機的通路路徑優選走A中心方向。

Egress方向(虛機到客戶機):A、B中心的彙聚層裝置已實作二層互通,并且四台彙聚裝置加入到同一個VRRP組,通過調節VRRP的裝置優先級保證VRRP的VIP優選位于A中心的彙聚層裝置。虛機的網關指向VRRP的VIP,由此虛機的Egress流量優選從A中心到客戶機的路徑。

分布式資料中心網絡互聯技術實作

圖2. 分布式資料中心的三層互聯路徑優化挑戰

傳統部署思路存在一個問題,如圖2右側拓撲,當虛機從A中心遷至B中心時,A、B中心向骨幹網通告的包含虛機位址的路由沒有變化(Ingress流量方向不變),VRRP的主備關系也沒有變化(Egress流量方向不變),是以位于B中心的虛拟機發出的流量必須通過跨中心的二層鍊路到達A中心的網關後,才能沿A中心的核心路由器被發往客戶機,而B中心一側的彙聚裝置和廣域網出口裝置并沒有被利用,這就出現了“次優路徑”現象。

對于分布距離較近的A、B中心(例如,位于同一個園區的兩座建築),這種部署不會帶來更多的管理複雜性,容易被客戶接受,但對于分區較遠的A、B中心(數十公裡),客戶通常會希望根據虛機所在位置動态調整Ingress和Egress流量路徑,確定客戶機與虛機之間選擇最優路徑,以避免遠距離排錯和網絡管理上的複雜性。

目前解決三層網絡次優路徑的關鍵技術如下:

Ingress方向(客戶機到虛機)的技術

動态DNS解析技術。

同一個虛機在不同資料中心通過NAT(由SLB裝置實作)呈現不同的服務IP位址。GSLB作為DNS伺服器,并根據虛機所在的實體位置向客戶機解析成不同的服務IP位址。這裡的關鍵技術時如何向GSLB通告虛機的實體位置并修改DNS記錄。

RHI(Route Health Injection,路由健康注入)技術。

該特性通常由SLB裝置實作,SLB周期性的檢測伺服器/虛拟機的存活狀态,當檢查結果正常時,SLB向骨幹網中釋出一條該虛機位址的主機路由;當檢查結果異常時,撤銷該主機路由。由此就可以動态的調整從客戶機到A或B中心的Ingress流量路徑。

Egress方向(虛機器到客戶機)的技術

網關分離技術。為避免Egress方向的次優路徑,必須在分布式資料中心兩側的彙聚交換機上同時部署相同的VRRP配置(A、B中心的彙聚裝置上具有相同的VRRP VIP配置),并且還要保證VRRP所在VLAN的跨中心二層互通。如果彙聚裝置已經采用了基于H3C EVI技術的VLAN擴充,則預設支援VRRP的本地化部署,如果未部署類似EVI的技術特性,使用者也可以通過配置相應的指令行實作該VRRP的本地化部署。

綜上所述,為實作跨中心虛機遷移,分布式資料中心之間的三種網絡互聯的關鍵技術要求如下(如圖3所示)。

分布式資料中心網絡互聯技術實作

圖3. 分布式資料中心的三類網際網路絡

存儲網絡互聯。跨中心的存儲網絡互通是保證虛機動态遷移的必備條件,可采用“共享存儲方式”或“雙活存儲方式”。

二層網絡互聯。虛機動态遷移之後IP位址不變,是以在虛機網絡接入層應建構跨中心二層網絡。可采用EVI、VPLS、DWDM/Dark Fiber等技術來實作。

三層網絡互聯。企業園區或分支機構的客戶機通三層網絡通路各資料中心,對于能支援虛機跨中心遷移的分布式資料中心來說,傳統三層網絡部署方案通過跨中心統一部署VRRP實作單側網關出口,但該方案存在三層次優路徑問題;一種新解決方案是采用“網關分離技術”并配合“RH技術或動态DNS技術”以優化三層轉發路徑。

02

伺服器高可用叢集跨中心部署

分布式資料中心的另一個應用場景是跨中心的伺服器高可用叢集部署。伺服器高可用叢集(HA Cluster),是借助叢集軟體将網絡上的多台伺服器關聯在一起,提供一緻的服務,對外表現為一台邏輯伺服器,在叢集内同一時間隻有一台實體伺服器接管服務IP并對外提供通路,當該伺服器發生故障時,備份實體伺服器将接管服務IP以繼續對外提供通路。高可用叢集在發生伺服器切換時,不會保留切換前的計算狀态(如網絡協定棧、記憶體、CPU等)。如圖4所示。

分布式資料中心網絡互聯技術實作

圖4. 伺服器叢集高可用叢集

各廠商(HP、IBM、微軟、Veritas等)的叢集軟體需要各伺服器采用共享存儲、雙活存儲或支援同步複制的Active/Standby存儲;由于叢集切換之後的服務IP沒有變化,是以跨中心部署高可用叢集時不僅需要實作跨中心VLAN擴充,高可用叢集間部署的網絡心跳鍊路(Heartbeat)也必須在同一個VLAN内。

與虛機遷移應用情況相似,高可用叢集在跨中心部署時也要考慮三層路徑優化問題,其部署方式同虛機場景相同。

繼續閱讀