天天看點

雲計算之路-阿裡雲上-陣雨:RDS故障的突襲

風雨之後是彩虹,經曆了三個月的風雨之後,從6月14日起(上次故障發生于6月13日)開始享受彩虹。。。而今天突襲而來的RDS故障讓我們懂得了彩虹期間會有陣雨,但不管怎麼樣,離“晴空萬裡”越來越近了。

雲計算之路-阿裡雲上-陣雨:RDS故障的突襲

2013年7月23日10:00~11:00左右,我們使用的阿裡雲RDS(關系型資料庫服務)突然出現故障,造成了網站不能通路(大家通路時遇到的502錯誤就是故障的表現)。由此給大家帶來了很大的麻煩,我們深表歉意!望大家諒解!

這次502故障發生時,我們先從伺服器上的錯誤日志下手,一下子将故障的引發點逮個正着:

System.Data.SqlClient.SqlException (0x80131904): 在從伺服器接收結果時發生傳輸級錯誤。 (provider: TCP Provider, error: 0 - 遠端主機強迫關閉了一個現有的連接配接。)

資料庫連接配接被強制關閉,那問題肯定與RDS有關。

10:05聯系阿裡雲客戶經理,10:06送出工單。。。

接着,通過telnet至RDS的端口确認是不是網絡問題引起的,telnet正常連接配接,說明網絡沒問題,問題在RDS本身。

接下來就是阿裡雲的工程師在忙,我們隻能緊張而焦急地等待。。。

11:00左右,RDS切換至鏡像節點(RDS做了資料庫鏡像)之後,網站立即恢複正常。

對于故障的真正原因,阿裡雲工程師接下來會進行全面的分析。多希望有一天阿裡雲能像Amazon一樣,将每次故障的原因及處理情況對外公開。

就這樣經曆了一場雲上的陣雨,有人在微網誌上說我們是阿裡雲踩坑大師,我們希望踩一個少一個,同時希望阿裡雲找出所有的坑一個一個填平,隻要有坑,總會被人踩着的。

繼續閱讀