5月,SIGCOMM 2020公布了今年的入選論文,阿裡雲網絡産品的” VTrace: Automatic Diagnostic
System for Persistent Packet Loss in Cloud-Scale Overlay Network”是國内曆年來唯一一篇雲網絡方向的入選論文,今年SIGCOMM總計收到了250篇投稿,成功入選的僅54篇,阿裡雲網絡産品洛神平台的技術實力得到了網絡業界頂級會議的認可。

超大規模下的雲網絡異常定位
如果把我們每天在用的手機App當成現實生活裡的商場,電影院,餐館的話,雲網絡就是把這些商場,電影院和餐館連接配接在一起的高速公路。在現實社會裡,如果我們駕車去電影院時發現路堵了,可能會導緻我們錯過一場期待已久的電影,同樣的,在雲網絡的世界裡,當某個裝置發生擁塞或者事故了,會導緻各種應用出現異常,給我們看到的現象就是App很卡,視訊打不開等。
面對這個問題,雲網絡業需要一個”交警”,每當網絡中間有擁塞或者事故了它需要能夠及時發現具體位置,然後及時處理,來讓整個網絡恢複正常。差別于傳統的交警,一旦出現問題,雲網絡的這個交警需要能在幾秒鐘内從這張遍布全球數百萬的裝置裡找到定位到問題,這對雲網絡的交警帶來了非常大的挑戰。
傳統網絡工具 VS 大資料染色封包分析
在阿裡雲網絡團隊之前,雲網絡碰到類似問題隻能用網工三闆斧來處理: 抓包,ping, trace。這個方式在雲網絡上無論是性能上還是可操作性上都非常差,這也是讓所有雲網絡工程師在排查問題時頭疼的地方,傳統的方式玩不轉了。
阿裡雲網絡産品團隊首次采用大資料結合染色封包的方式,通過大資料技術給這個交警配備了一個超強的大腦,讓他能實時處理千萬級網絡資料,同時,結合染色封包技術讓所有網絡裡面的資料包資訊實時傳遞給我們的雲網絡交警。最後的結果就是這個雲網絡交警能實時感覺到整個雲網絡每台裝置的丢包和擁塞情況。阿裡雲網絡産品團隊給這個交警取了一個名字,叫vTrace。當使用者在上網過程中碰到網絡問題時,vTrace能很快找到對應鍊路上出現問題的節點在哪裡,解決了雲網絡排查問題難的痛點,加快使用者網絡問題恢複過程。
目前該項技術已經在阿裡雲網絡内部大規模普及,未來将會逐漸開放給阿裡雲使用者,讓阿裡雲使用者業能享受到vTrace帶來的秒級網絡問題定位能力。
關于阿裡雲網絡:全球最豐富網絡産品家族,數百萬企業的首選
雲網絡是阿裡雲核心的基礎産品線,目前已擁有20+款網絡産品,是業界最豐富的網絡産品家族,涵蓋雲上網絡、混合雲網絡、跨地域網絡等諸多企業網絡場景。
阿裡雲網絡産品已服務新浪微網誌、優酷、12306等全球數百萬企業,世界杯、春晚、春運等大流量、國民級應用場景都有阿裡雲網絡産品的身影。
這些雲網絡産品的背後是基于全自研網絡技術的飛天洛神雲網絡平台,目前已經更新到洛神2.0,連接配接全球,超大規模,彈性開放是洛神提供的核心能力。目前,阿裡雲已經建立全球網絡基礎設施,覆寫全球21個地域,63個可用區,110+個POP點,2600+個邊緣節點。