服務器數(shù)據(jù)恢復環(huán)境:
兩組分別由4塊SAS接口硬盤組建的raid5陣列,兩組raid5陣列劃分LUN并由LVM管理,格式化為EXT3文件系統(tǒng)。
服務器故障:
RAID5陣列中一塊硬盤未知原因離線,熱備盤自動激活上線替換離線硬盤。在熱備盤上線過程中,raid5陣列中又有一塊硬盤離線。熱備盤同步失敗,該raid陣列崩潰,LVM結構變得不完整,文件系統(tǒng)無法正常使用。
將故障RAID5陣列中的兩塊離線硬盤標記后取出進行檢測,發(fā)現(xiàn)先離線硬盤無法識別,初步推斷該盤存在硬件故障,需要開盤修復,另一塊硬盤可以正常識別。
服務器數(shù)據(jù)恢復過程:
1、將故障raid中其他沒有離線的硬盤標記后取出。硬件工程師對這些硬盤進行檢測后沒有發(fā)現(xiàn)有硬盤存在明顯硬件故障,都可以正常讀取。以只讀方式將完好的硬盤進行扇區(qū)級全盤鏡像。鏡像完成后將所有磁盤按照原樣還原到原服務器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。硬件工程師在無塵工作間對故障硬盤進行開盤修復操作。開盤后發(fā)現(xiàn)該硬盤盤片磨損嚴重,無法修復,只能對陣列進行缺盤處理。
為了安全起見,對另一組raid陣列的全部成員盤進行只讀全盤鏡像。
北亞企安數(shù)據(jù)恢復—RAID5數(shù)據(jù)恢復
北亞企安數(shù)據(jù)恢復—RAID5數(shù)據(jù)恢復
2、基于鏡像文件分析硬盤底層數(shù)據(jù)。解析EXT3文件系統(tǒng)結構,分析兩組raid5陣列的盤序、條帶大小、校驗方向等配置信息。根據(jù)上述分析出來的信息重組兩組raid5陣列。由于有一塊硬盤無法修復,所以在重組故障raid時只能做缺盤處理。
北亞企安數(shù)據(jù)恢復—RAID5數(shù)據(jù)恢復
北亞企安數(shù)據(jù)恢復—RAID5數(shù)據(jù)恢復
3、兩組raid5陣列重組完成后分析底層數(shù)據(jù),找到LVM結構信息并分析LVM結構。將兩組raid中作為PV(LVM物理卷)的LUN導出,然后將兩個PV重組,重新生成LVM邏輯卷。
北亞企安數(shù)據(jù)恢復—RAID5數(shù)據(jù)恢復
北亞企安數(shù)據(jù)恢復—RAID5數(shù)據(jù)恢復
4、LVM重組完成之后,使用北亞企安自主開發(fā)的工具解析LV(邏輯卷)中的EXT3文件系統(tǒng),恢復并導出其中的全部數(shù)據(jù)。
北亞企安數(shù)據(jù)恢復—RAID5數(shù)據(jù)恢復
5、在恢復出來的數(shù)據(jù)中挑選部分壓縮文件進行校驗,發(fā)現(xiàn)部分文件損壞。對比解析結果和恢復結果,發(fā)現(xiàn)部分文件損壞且無法恢復。經(jīng)過分析,初步判斷文件損壞與兩組raid中部分硬盤存在壞道有關。
兩組raid中部分硬盤壞道情況:
Raid 1:2# 67 bad source sectors encountered.
4# 13 bad source sectors encountered.
Raid 2:2# 37 bad source sectors encountered.
6、由于故障硬盤損壞嚴重,無法修復,且部分硬盤存在壞道,導致raid結構存在缺陷,部分文件損壞。經(jīng)過用戶方驗證,大部份文件恢復出來了,只有小部分文件丟失或者損壞,用戶方認可數(shù)據(jù)恢復結果。
審核編輯 黃宇
-
服務器
+關注
關注
12文章
9681瀏覽量
87235 -
數(shù)據(jù)恢復
+關注
關注
10文章
635瀏覽量
17988
發(fā)布評論請先 登錄
服務器數(shù)據(jù)恢復—raid5陣列多塊硬盤離線導致EMC存儲不可用的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—raid5陣列崩潰導致上層lun無法正常使用的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列熱備盤未全部成功啟用的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—硬盤離線導致Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—raid5陣列熱備盤未完全激活導致陣列崩潰的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—存儲中RAID5陣列兩塊盤離線的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—EMC存儲中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—raid5陣列硬盤壞道導致raid崩潰的數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—磁盤不穩(wěn)定被踢導致raid5陣列崩潰的數(shù)據(jù)恢復案例

服務器數(shù)據(jù)恢復—X3650服務器raid5磁盤陣列數(shù)據(jù)恢復案例
服務器數(shù)據(jù)恢復—RAID5陣列硬盤報警亮黃燈的數(shù)據(jù)恢復案例

評論