天天看點

虛拟機資料恢複全過程(ESX SERVER均無法連接配接到DS4100所在的STORAGE)

中石化某省分公司的資訊管理平台,幾台vmware虛拟機——esx server共享一台ibm ds4100存儲,大約有40~50組虛拟機,占用1.8tb空間,正常工作中,vc裡報告虛拟磁盤丢失,ssh到esx中執行fdisk -l檢視磁盤,發現storage已經沒有分區表了。重新開機所有裝置後,esx server均無法連接配接到ds4100所在的storage。

我們接到案例後仔細詢問當時的管理者但是可用資訊不多,但是他們無意間提到曾經在這個存儲網絡裡連接配接過一台windows 2003伺服器,具體情況不詳。于是很自然地想到了,可能是那台windows 2003因對storage的獨享操作導緻了整個vmfs卷損壞。

以整個存儲做分析發現分區表清0,有55aa有效結束标志,有硬碟id标志。簡單從前向後檢視,發現一個ntfs卷,但似乎并未寫資料進去,像一個剛剛格式化的卷,對這個ntfs卷的bitmap做分析,得知大小約為1.8t(全部空間),前部占用部分空間,3g左右位置占用部分空間,0.9t附近占用部分空間,但總占用空間不超過100m。針對vmfs卷進行分析,發現在原1.8tb的磁盤裡有2組vmfs分區,第2組是對第一組的extend,第一組約1.5t,第二組約300gb,因ntfs分區并未寫資料到第二個vmfs分區裡(最後一個扇區的dbr備份沒有覆寫有用資料),是以重點在于第一個vmfs分區。分析第一組vmfs,卷頭結構丢失,一級索引、二級索引均存在,ntfs覆寫的資料區正好是某組虛拟機的臨時記憶體鏡像,損壞也無妨。

通過以上分析,我們就可以進行資料的恢複了,

第一步:對整個storage進行鏡像備份。

第二步:分析後,連接配接兩個vmfs分區,直接按照vmfs分析組織方式提取所有vmdk及配置檔案。

第三步:通過nfs直接遷移回esx server。

另:本例中因已對故障存儲做了安全備份,修複中同時直接重建第一組vmfs卷頭,索引清單、分區表等資訊,直接附加在esx server環境,算是第二個方案。

經過兩天的努力,資料成功恢複,在此感謝工程師們為此付出的努力。

[其他]

1、本例中依然是因為光纖環境互斥不當導緻的問題,實際上,應該是這個卷在windows系統做了重新分區,并格式化成了ntfs,之後又對分區做了删除操作。因esx vmfs的互斥不依賴于硬體,隻依賴于作業系統驅動層,是以在其他伺服器接入存儲網絡時一定要小心,盡量考慮好存儲配置設定權限。

2、esx因便捷的資訊集中管理,真正使用中往往資料特别重要,一定要做好備份工作,并考慮損壞時遷移的友善性。

繼續閱讀