2020年1月8日,彈性計算服務技術總負責人張獻濤受邀出席“面對面 見未來”的沙龍分享活動,現場聽衆主要是銀行、保險、證券等金融行業的CTO、CIO等。

演講開始前,聽衆們了解神龍雲伺服器的并不多。在聽完張獻濤的介紹後,他們對神龍興趣大增,在分享結束後紛紛與張獻濤交流讨論,意猶未盡。
15年虛拟化技術之路
虛拟化是如今雲計算行業的基礎,然而虛拟化最早并不是針對雲設計的。
張獻濤回憶,他自2004年博士畢業後加入Intel虛拟化團隊,彼時國内虛拟化從業者少之又少,Intel也是在不久前決定在晶片中加入虛拟化的特性。
自此,張獻濤就踏上了虛拟化這條“人迹罕至”的技術之路。期間,随着亞馬遜、阿裡巴巴、盛大等公司開始涉足雲計算,虛拟化也越發受到大公司關注。
在Intel深耕該領域多年的張獻濤,發現在技術層面的探索已面臨天花闆。2014年,他帶着離客戶更近的想法,來到了阿裡雲。
“神龍”是如何誕生的
他回憶,最早的時候阿裡雲主要服務中小站長,他們對雲的服務能力要求不高。“有時候我們發現網站挂了之後,客戶過了半天都沒發現”。
雖然當時針對中小型客戶服務能力“夠用”,在2014年,阿裡雲在開始建構服務中大型客戶的能力。2015年前後,張獻濤帶領技術團隊對阿裡雲彈性計算服務的系統架構做了重新設計和全面更新,雲伺服器執行個體性能提升了數倍。
高速發展的阿裡雲,同時也面臨着質疑:“你們的雙11上雲了嗎?”
2014年,阿裡巴巴啟動了全面上雲計劃。“我們相信,如果雙11這種天量級場景都能跑,其他都不是問題。”張獻濤表示。
2016年,雙11絕大部分的流量完美運作在阿裡公共雲上,并且所有業務的性能損失都低于3%。然而,時任阿裡巴巴CTO的張建鋒,提出了更高的要求:把虛拟化資源和性能損耗降到零!
這在當時是完全不可想象的任務。阿裡雲技術團隊把自己逼到了極限,不斷思考如何從這3%裡再摳一點出來。
“幸運的是2016年發生兩件事:網際網路公司開始收購硬體公司;雲原生來了,容器浪潮席卷全球。”
這兩種趨勢的啟發下,張獻濤決定用軟硬一體的方式,借助晶片的offloading技術,把虛拟機損耗降到零。
“神龍”突破實體機極限,性能大幅提升
“原來我們都認為,虛拟化技術的極限,就是實體機性能。”讓人驚喜的是,張獻濤在定下實作路徑後,經過分析認為,軟硬一體協同設計的架構,有可能可以突破了他本來的想象邊界,比實體機的性能還要好。
基于論證,張獻濤團隊對自己提出了更為大膽的目标:突破實體機性能極限。
團隊最後如願以償。2019年,阿裡巴巴雙11核心系統全面上雲。資料顯示,容器在神龍雲伺服器上跑,性能比在實體機上提升20-30%。
發明創新,終究要回歸客戶價值
神龍表現喜人,張獻濤感悟,做技術還是要回歸客戶價值。“單純的喊話是不行的,我們需要解決他們的實際問題。”
阿裡雲的客戶要上雲,是因為雲解決了他的問題,不是為了上雲而上雲。
而今,随着阿裡雲的發展,客戶的要求與5年前不可同日而語,也對阿裡雲的服務能力作出了更嚴格的要求。
“之前客戶的問題,我們比客戶發現得還早。現在大客戶的維護系統,看得比我們還細,有任何一個抖動,可能工單就過來了,解決不好就成為故障了。服務能力一定要提高,大客戶對服務能力要求很高。”