天天看點

現場剪光纜!ATEC上支付寶模拟自斷一半伺服器,26秒一切恢複正常小螞蟻說: 史上最大膽的技術演習螞蟻金服ATEC主論壇金句摘要

小螞蟻說:

9月20日,杭州雲栖大會ATEC主論壇現場上演了一場特别的技術秀。螞蟻金服副CTO胡喜現場模拟挖斷支付寶近一半伺服器的光纜。結果隻過了26秒,模拟環境中的支付寶就完全恢複了正常。

現場剪光纜!ATEC上支付寶模拟自斷一半伺服器,26秒一切恢複正常小螞蟻說: 史上最大膽的技術演習螞蟻金服ATEC主論壇金句摘要

史上最大膽的技術演習

這是由支付寶工程師策劃的一次特别技術演練,他們基于支付寶的真實機房,在兩個城市各單獨搭建了兩個模拟機房,以測試當兩個機房同時下線後的系統穩定性。

現場大屏有個二維碼,觀衆掃碼就能登陸一個虛拟賬号體驗。兩個機房斷網後的約20秒内,賬戶頁面顯示系統異常,20秒後,觀衆全部都能順利轉賬了。

螞蟻金服副CTO胡喜解釋,這次是演習。而在真實環境下,如果支付寶部署在兩個城市的兩個機房同時出問題,跑在這兩個機房上的支付寶賬戶恢複正常的速度是分鐘級。

據了解,這一機房架構叫“三地五中心”,即在三座城市部署五個機房,一旦其中一個或兩個機房發生故障,支付寶的底層技術系統會将故障城市的流量全部切換到運作正常的機房,并且能做到資料保持一緻且零丢失。

目前網際網路和金融科技行業普遍采用的是“兩地三中心”部署架構,即在一個城市設兩個機房,在另一個城市設一個冷備機房。

胡喜強調,這個架構,絕不僅僅是多設立了兩個機房那麼簡單,它非常考驗一家公司分布式架構、資料庫、中間件及相關金融核心技術的能力。而這正是支付寶創立前十年修煉技術内功的結果。“支付寶的技術目标之一就是保證金融級别的系統穩定和安全能力。”

曾有行業人士做過機率計算,兩個城市多個機房同時故障的機率極低,基本不會發生。而即便發生了,現場的演習也展示出支付寶強大的容災能力。胡喜在現場和大家開起了玩笑:“這次演練,告訴了大家一個好消息,一個壞消息。好消息是,支付寶很安全,很穩定,至少要陪大家再過102年,壞消息是,不管剪多少光纜,花呗還是要還的。”

螞蟻金服ATEC主論壇金句摘要

— END —

螞蟻金服官方唯一對外技術傳播管道

投稿郵箱:[email protected]

歡迎留言及個人轉發,媒體轉載請聯系授權

繼續閱讀