天天看點

【伺服器資料恢複】AIX下raid5中2塊磁盤先後離線的資料恢複案例

作者:北亞資料恢複中心

伺服器資料恢複環境:

IBM P740小型機+AIX作業系統+Sybase資料庫+V7000存儲。V7000存儲配置了12塊SAS機械硬碟(其中一塊為熱備盤)組建一組raid5磁盤陣列。儲存設備一共建立了2組Mdisk,加到一個pool中。

伺服器故障:

IBM V7000存儲中的磁盤發生故障,從業人員更換磁盤後并進行資料同步,同步沒有完成時候存儲中的另塊磁盤出現故障,導緻邏輯盤無法挂接在小型機上,業務中斷。通過儲存設備的管理界面看到有2塊磁盤顯示故障脫機,其中10号位的故障盤為熱備盤,3号位的故障硬碟情況如下圖:

【伺服器資料恢複】AIX下raid5中2塊磁盤先後離線的資料恢複案例

北亞企安資料恢複——IBM存儲資料恢複

【伺服器資料恢複】AIX下raid5中2塊磁盤先後離線的資料恢複案例

北亞企安資料恢複——IBM存儲資料恢複

主要資料pool現在無法加載,共三個通用卷均無法挂載,如下圖:

【伺服器資料恢複】AIX下raid5中2塊磁盤先後離線的資料恢複案例

北亞企安資料恢複——IBM存儲資料恢複

伺服器資料恢複過程:

1、将故障存儲中所有磁盤編号取出,将沒有問題的10塊磁盤以隻讀方式做全盤鏡像,發生故障的2塊磁盤使用專業工具處理後做鏡像。後續所有的資料分析和資料恢複操作都基于鏡像盤進行, 避免對原始磁盤資料造成影響。

方案1、對存儲進行強制上線操作。

a、分析故障存儲中故障硬碟的離線順序。

raid5最大允許一塊成員盤離線,該儲存設備已經失效,各組Mdisk中隻有一塊硬碟離線。提取故障存儲的日志,通過分析日志可以得到各故障硬碟的離線順序。

b、修複後離線的故障硬碟。

c、将修複的硬碟插回存儲中進行強制上線操作。

方案2、解析存儲結構。

a、根據使用者方給出的配置資訊将硬碟按照Mdisk組分類。

b、通過分析每一組Mdisk中的所有硬碟擷取到raid相關資訊。

c、虛拟重組Mdisk。

d、通過分析重組出來的Mdisk擷取到pool的相關資訊。

e、解析pool在Mdisk上的分布情況,分析pool中的條帶大小。

f、解析LUN位圖,分析各LUN在pool中的分布情況。

g、北亞企安資料恢複工程師編寫程式提取LUN。

伺服器資料驗證:

随機抽樣檢測生成出的資料,沒有發現問題。在使用者方準備好的儲存設備上建立與原環境一樣大小數量的LUN,将提取出來的資料LUN的鏡像檔案複制到存儲上建立的LUN中。資料移交後,使用者方工程師重新配置存儲環境,經過檢測一切正常。本次資料恢複工作完成。

繼續閱讀