天天看點

6塊300G SCSI RAID5,兩塊硬碟損壞後的資料恢複過程

【使用者機關】

xxxx網站

【資料恢複故障描述】

dell poweredge 2850伺服器,内置6塊300g scsi硬碟 ,組成raid5,安裝linux redhat 4作業系統,存儲大量照片,檔案系統采用ext3。據後期推斷,早先已有一塊硬碟離線,但機房内并未發現,直至另一塊硬碟掉線後系統癱瘓才知道。dell工程師建議将其中一塊硬碟強制上線,但同時指出操作具有風險。使用者将某盤強制上線後,發現作業系統啟動時異常,感覺不妙,于是關掉伺服器,尋求專業資料恢複機構服務。

【資料恢複故障分析】

此類故障非常普遍,raid5僅支援唯一一塊硬碟掉線的備援保護,當兩塊硬碟先後離線後,raid即無法通過運算提供完整資料塊,raid便會下線。同時,控制器為了穩定起見,隻要有硬碟下線,便不會自動上線,這樣不通過人為幹預,raid但會進入癱瘓狀态。通常情況下,因raid控制器的敏感性,掉線的硬碟多數不會有嚴重的實體問題,許多甚至于硬碟完好(掉線是因為信号受阻,電源波動或控制器bug等随機原因),是以資料恢複的可靠性較高。強制上線具有較大的風險,如果上線錯誤,會導緻控制器自動做某些不可逆的操作,如果再進入作業系統,因檔案系統不一緻,會導緻修複,繼而導緻全部硬碟資料不一緻。本例即是如此。

【資料恢複過程】

1、完整備份所有硬碟,發現有多塊硬碟已經存在壞道,隻是raid沒有讀到,暫時無下線。

2、在備份中分析原來raid的組成結構,建構虛拟raid環境。

3、驗證raid結構正确,修正部分後期破壞的結構後将資料導出到另一中間存儲。

4、重新用完好硬碟搭建dell 2950上的新raid5。

5、将資料遷移至新raid。

【資料恢複結論】

曆時2天,資料庫100%恢複成功。上千萬圖檔檔案中抽樣檢測,有極少數出現問題(機率及理論推斷,不超過萬分之一)

6塊300G SCSI RAID5,兩塊硬碟損壞後的資料恢複過程

【資料恢複服務承諾】

1 .免費檢測

與客戶簽訂保密協定(非定制免費),對客戶的資料嚴格保密

資料恢複不成功不收費

專業工程師提供服務,同時由其他工程師稽核、會診資料恢複方案及流程

資料恢複前報價,客戶确認後工程師開始資料修複

整個恢複過程不會對客戶的原盤有任何的寫操作,以確定原盤的資料完全