天天看點

親寶寶:使用AHAS故障演練實作具備韌性的系統架構

親寶寶是一個專注于為孕期以及 0-6 歲家庭提供育兒服務的移動網際網路平台。公司旨在運用科技的力量,幫助家庭更好地關愛和培育孩子。核心産品“親寶寶 APP”于 2013 年正式上線,以成長記錄、智能育兒助手為核心功能,為年輕家庭提供私密親子空間、線上早教、專業養育知識、 社群交流、母嬰商品等一站式育兒服務,截至 2019 年底,親寶寶的注冊使用者已經超過 1 億。

2020年上半年,親寶寶使用者保持高速增長,其技術團隊也逐漸發展壯大。系統穩定性風險是技術團隊面臨的最大挑戰之一,特别是在容器技術下的微服務架構,服務間調用錯綜複雜,應用依賴衆多,對系統穩定性提出了以下訴求:

• 在微服務依賴治理,需具備逾時、重試、降級及預案等容錯能力。

• 容器架構模式下,需具備業務面對突發流量的彈性伸縮能力。

• 中間件或雲服務在出現故障時,業務需要具備容錯能力。

• 應用服務在面對不穩定網絡環境時,需要具備自愈能力。

如何滿足親寶寶對穩定性的需求?

親寶寶:使用AHAS故障演練實作具備韌性的系統架構

解決方案架構圖

為了快速驗證系統的容錯能力,親寶寶采用了阿裡雲應用高可用服務AHAS中的故障演練平台解決方案:

• 通過模拟殺服務Pod、殺節點、增大Pod資源負載,觀察系統服務可用性,驗證叢集的彈性伸縮能力是否符合預期。

• 通過模拟應用無法連接配接消息、緩存以及資料庫,驗證系統在逾時設定以及預案的有效性。

• 通過模拟網絡不穩定場景,驗證業務系統的影響範圍。

通過引入成熟、穩定的阿裡雲混沌工程解決方案,親寶寶的系統架構在面對複雜業務下頻繁疊代時,系統依然具備面對失敗的容錯能力,業務表現得更穩定、健壯、彈性。親寶寶的IT團隊也通過方案背後所融入的方法論,掌握了一套适合自己團隊的應對故障的預防機制,并且開始實踐演練常态化、自動化機制。

關聯産品

應用高可用服務 AHAS :

https://www.aliyun.com/product/ahas

掃碼了解更多技術内容與客戶案例:

親寶寶:使用AHAS故障演練實作具備韌性的系統架構