前言
上期本文對混合雲組網建設的前提條件、需要評估的方面以及相關規劃進行了介紹。組網建設完成後,後續還會涉及到相關運維如流量監控、并網、網絡更新等内容,本期将繼續進行介紹。
流量監控
監控專線帶寬使用情況是日常網絡維護的重要手段,目前主要通過監控線下IDC的接專線端口的網絡流量即可知道專線網絡的使用情況。如果是雙線ECMP(Equal-Cost Multipath Routing,等價多路徑)模式,當專線帶寬使用總量超過50%,如果其中一條專線中斷,僅存的一條專線将無法承接中斷專線帶來的流量。這時候需要擴容專線帶寬,使專線帶寬的備援保持在50%以上。

圖1:流量監控示意圖
并網
公司間的兼并收購帶來兩個公司的資訊資料共享,網絡合并勢在必行。網絡合并最大的難題是兩個公司的網絡位址規劃可能有重合,網絡位址可能會互相沖突。并網前需要優先解決網絡位址規劃,一般解決方法為其中一家公司重新規劃網絡位址段,避開沖突網段。
如果兩個公司位址沒有沖突,那麼可以直接進行并網,并網的方式有兩種:一種是把收購公司的VPC和本公司的邊界路由器之間通過高速通道連接配接,這樣能做到本公司IDC網絡、本公司VPC網絡和收購公司VPC網絡三方互通。另一種是把收購公司的VPC和本公司VPC網絡通過高速通道打通,這樣隻能做到雲上兩個VPC直接互通,給自己IDC的網絡留一點“私密空間”。
圖2:三方互通并網示意圖
圖3:僅VPC互通并網示意圖
網絡更新
帶寬更新
随着已經上雲業務的增長以及更多業務上雲,專線帶寬的資源會有擴容的需求。一般通過增加網絡裝置端口可以滿足,但量變引起質變,之前建設時選用10G的端口類型,擴容到200G以内帶寬還是可承受的,但再往上擴容會涉及到增加端口多、帶寬升幅不大的問題,日後一旦出現專線帶寬丢包問題,龐大的端口數量給排查帶來的難度可想而知。是以擴容到一定程度必須更換網絡裝置,選取擁有更大端口帶寬的網絡裝置。
專線網絡裝置更新
更新方案評估
- 租營運商帶寬還是擴容自己的網絡裝置。
- 在原有鍊路上更新還是選新的接入點。
兩種割接方案
新舊裝置并行割接方案:建立鍊路接到新邊界路由器上,新邊界路由器可以了解為新購買的網絡裝置。這樣做可以讓新老鍊路同時線上,後期割接隻修改路由,如果新鍊路有問題回退也快捷,隻需更改路由就可回退原有網絡路徑。
圖4:新舊裝置并行割接方案示意圖
逐邊更新割接方案:不用新租鍊路,在原有鍊路上更新,更新時保持一邊原有鍊路不動,切斷一邊原有鍊路接到新裝置上,檢查鍊路品質、配置新裝置上的路由。待新鍊路得到驗證後,如法炮制把另一條原有鍊路更新。該方案需注意:首先保證割接時專線使用帶寬低于總帶寬的50%,保證單邊能承載。第二,該方案在割接時中斷的時間比并行方案時間長,且回退複雜,條件允許的情況下還是推薦并行方案。
圖5:逐邊更新割接方案示意圖1
圖6:逐邊更新割接方案示意圖2
作者:孟亮
阿裡雲智能GTS-SRE團隊技術服務經理
主持過2016和2017年12306春運護航,2015年至今深耕服務于阿裡雲重要客戶——微網誌,通過阿裡雲的彈性能力幫助微網誌解決不可預期、不可估量的熱點事件應對問題,解決客戶最關心的大并發量快速彈性擴容難題并不斷優化。
我們是阿裡雲智能全球技術服務-SRE團隊,我們緻力成為一個以技術為基礎、面向服務、保障業務系統高可用的工程師團隊;提供專業、體系化的SRE服務,幫助廣大客戶更好地使用雲、基于雲建構更加穩定可靠的業務系統,提升業務穩定性。我們期望能夠分享更多幫助企業客戶上雲、用好雲,讓客戶雲上業務運作更加穩定可靠的技術,您可用釘釘掃描下方二維碼,加入阿裡雲SRE技術學院釘釘圈子,和更多雲上人交流關于雲平台的那些事。