天天看點

雙11阿裡雲技術負責人楊旭:大考亦從容

楊旭,花名楊曦,這是他的第六個雙11。

從2012年開始,阿裡雲通過雲計算技術為天貓雙11提供計算服務。

3年前,楊旭開始作為雙11阿裡雲技術負責人,負責搭建全球最大的混合雲結構,把 “雙11”的電商業務和技術場景在阿裡雲上實作,并保障這個混合雲在雙11當天能夠滿足全球客戶的購物需求。 

11月11日晚上零點整,海量峰值如期而至,項目室裡的每一個人都屏息靜氣的看着陡增的峰值。

幾個小時以後,第一波峰值順利度過,項目室裡又恢複了喧鬧。 

“每一年的雙11,都是一次趕考。”楊旭一邊喝可樂,一邊與記者聊了起來。

雙11阿裡雲技術負責人楊旭:大考亦從容

楊曦

<b>充分準備是成功的關鍵</b><b></b>

阿裡雲的技術支援,早在一年前就開始準備了。去年12月中旬左右,楊旭就籌備召開了阿裡巴巴的2017的雙11策劃會,制定了工作目标,詳細到每個單元的産品和技術方案的驗證。通過多次測試,以及全鍊路的壓測,確定所有的方案和實施都能滿足雙11的業務需要。

在楊旭看來,這其中的每一項工作都關系到今年雙11的阿裡雲表現,每一項工作都是一道考題。“特别是下半年壓測的時候,隻有那麼幾次機會,如果不成功可能要影響整個雙11的項目結果,壓力大的時候,經常半夜睡不着覺,夢裡都在記錄解決方案。”

有一次遇到一個業務問題沒解決,擔心影響到雙11的交易成功率,整個團隊基本一個星期通宵處理問題,優化更新系統。楊旭說,為了支援這個項目,團隊很多同僚也都犧牲很大。壓測期間,網絡業務線抽調的一位同僚整整48小時沒有睡覺,等解決完問題回家,才想起2天前準備給妻子過生日的蛋糕,還藏在卧室的衣櫃裡,打開櫃門一看,蛋糕早已融化。有時候問題緊急,還常常請相關業務的同僚半夜從家裡來現場支援。“阿裡雲的雙11團隊,這是一隻鐵軍”,楊旭感慨的說。

從2012年的最小單元驗證開始,阿裡雲不斷疊代優化,2017年,已經成長為“應用+存儲+緩存+資料庫+網絡”的全業務上雲的混合雲解決方案,可以有效應對處理雙11這樣的脈沖計算。

雙11阿裡雲技術負責人楊旭:大考亦從容

雲化架構使多個資料中心像一台計算機一樣來管理,可以跨多個不同的平台來排程業務發展所需的資源,建構混合雲以極低成本拿到伺服器,通過混合部署大幅提升資源使用率,支撐系統容量。在今年雙11,阿裡交易峰值再創新高達到32.5W筆/秒,這背後是靠雲化架構在支撐,得以真正實作彈性資源平滑複用、任務靈活混合部署。

有了阿裡雲的保駕護航,楊旭表示,距離雙11的成功更近了一步。 

<b>談笑間方顯大将風範</b><b></b>

早在今年9月底,楊旭就帶領隊伍進了阿裡巴巴西溪園區的作戰室。11月9日晚上20點,在1号樓,阿裡雲的雙11項目正式拉開帷幕。 

在頂層的作戰室裡,楊旭帶領着這個位于全球各地,共百餘人的隊伍,在雙11的24小時内保障了視訊雲、圖檔雲、電商雲、金融雲、物流雲的正常運轉。 

累了,團隊的同僚就找個凳子,或者按摩椅睡上1-2個小時,這個時候,業務部門的就會有負責這塊工作的其他同僚頂上,保證雙11期間阿裡雲上所有業務都有人實時盯守。 

“所有人都有人輪換,隻有我是10号晚上八點進去,11号淩晨才能出來。”楊旭笑着告訴記者。“這不僅僅是阿裡雲的項目,更是阿裡巴巴的項目,還是全國人民,甚至全球人民的狂歡購物節,不能出一點差錯。”。 

阿裡雲的能力雖然讓楊旭信心十足,但今年的大考,又比往年更不容易。 

零點将至,雖然有些疲憊,但楊旭似乎越來越有信心,甚至成為了項目室情緒的調動者。

“大家雙11的購物車都裝滿了嗎?”楊旭的這個問題,讓項目室裡七嘴八舌起來。

一切似乎盡在掌握中,直到零點将至,氛圍開始變得嚴肅起來。 

零點時分,大促正式開始,不斷的有人在小聲報出各個名額。 

“水位正常!”

“資源正常!”

“核心鍊路暢通!” 

這是最緊張的時刻,然而楊旭告訴記者。

“養兵千日,用兵一時,這個時候我是最放心的人。” 

2017年天貓雙11購物狂歡節開場僅11秒交易就額破億,3分鐘突破100億,6分鐘超200億,24小時後成交額定格于1682億元。今年交易峰值32.5萬/秒,支付峰值25.6萬/秒,比去年增長超1.1倍,再次重新整理全球紀錄。

雙11阿裡雲技術負責人楊旭:大考亦從容

 脈沖計算

在持續高壓力沖擊下,整個雙11期間阿裡雲表現堅如磐石,各項技術名額也再次重新整理世界紀錄。直播支撐了4000萬使用者觀看晚會,CDN提供了80T的通路加速帶寬,混合雲提供了将近100萬的彈性計算資源排程,存儲提供了340P的圖檔存儲和2.3萬億的檔案,物流雲全天支撐訂單流轉8億+,ApsaraDB資料庫最高QPS達到554萬,HTTPDNS在承載上千億次日解析量的同時保持了平均10ms以下的低響應延遲……

這一串串華麗數字的背後,作為整個天貓商家的基石,阿裡雲是如何保障在零點洪峰來臨時候穩定、安全和順暢?

楊旭認為,優秀的産品和技術是阿裡雲制勝的法寶,舉幾個例子:

直播技術:窄帶高清2.0技術,使用者觀看品質上以360P帶寬可以達到480P清晰度,480P帶寬可以達到720P清晰度,同樣清晰度下帶寬節約30%,H.265相當比H.264為使用者節約30%帶寬。

計算能力:通過對虛拟化技術的優化,讓極限情況下虛拟機的計算能力和實體機保持一緻,後續阿裡雲将進一步挖掘産品的計算能力。阿裡雲還推出了神龍伺服器,通過異構計算徹底将虛拟化損耗降為0。

執行個體存儲:通過結合SPDK+DPDK減少IO通路路徑,可以将單機的IOPS提高到210w,滿足大計算、重IO的高端使用者場景。

CloudDBA産品:通過自動化,自助化小白診斷,實作物流雲等商家的全覆寫,實作事務分析,TOP SQL,SQL Review,死鎖分析等全場景自動化,無論是給客戶,還是給阿裡雲自己都節約成本,提升使用者體驗。

大資料:線下推出感覺零售産品,通過資料化向智能化的轉變,讓資料也有情感,提升新零售的轉化率。

<b>用最好的技術回饋社會</b><b></b>

阿裡雲的技術每年都在突飛猛進的發展,即便作為一名資深技術人員,楊旭每年也會被新的技術、新的産品所深深震驚,比如今年雙11阿裡雲部署的網絡産品,使用的規模非常大,對性能的支援力度很大,這在全球也是領先的水準。

“馬總說過,雙11是鍛煉技術的。我們雲上的技術方案,新技術的嘗試,新的産品都會先自己驗證,然後再給客戶用。特别是通過全球唯一的雙11這種極端環境對新技術壓測,還有每年多次大型活動和項目的錘煉,讓我們的産品和技術都有最好的保證,然後我們會沉澱下來,放在公有雲上再提供給客戶使用。” 楊旭時刻謹記,在阿裡巴巴客戶永遠是第一位的。 

阿裡雲的雙11混合雲架構,是全球最大的混合雲架構,具備極緻的彈性排程管控能力,楊旭認為,這套成功的經驗可以快速滿足公司國際化戰略對全球資源部署的排程。 

在楊旭看來,雲計算不是簡單的實體機虛拟化,更是一種計算和服務能力的展現,目前雲上的産品大多是阿裡雲内部精華技術的沉澱,希望大家以一種開放的心态來用擁抱雲計算,大膽嘗試使用新技術,一定有意想不到的收獲

正是因為每個團隊在這幾個月裡默默的努力和不放過每一個細節,才讓今年雙11變成史上最輕松的雙11。 

“我們不僅完美的支撐的阿裡巴巴的主戰場,也可以驕傲的說我們用最完美的技術支撐了全社會的狂歡,我們阿裡雲客戶的狂歡!今年的雙11,非常完美”。在11月12日淩晨2點的阿裡巴巴西溪園區,連續值守52小時後,楊旭順利完成了今年雙11混合雲的接入和保障任務,他揉着雙眼,輕松地笑着說。 

技術擴充着商業的邊界,商業的效率,創造着生活的美好前行,雙11的技術能力,終将化為未來社會的常态。以阿裡雲為代表的雲計算行業,也已是社會的基礎設施,正如所有的超級工程一樣,一個個工程師們的努力,将異想天開的想象力變成了現實。這樣的故事在過去的一百年,兩百年,一千年,兩千年間不斷發生,才讓人類得以創造出任何生命都未曾創造出的奇迹,這個奇迹被人們稱為:文明。