服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
DELL PowerVault系列某型號(hào)存儲(chǔ),15塊硬盤搭建了一組RAID5磁盤陣列。
服務(wù)器故障&檢測(cè):
存儲(chǔ)設(shè)備raid5陣列中一塊磁盤由于未知原因離線,管理員對(duì)該磁盤陣列進(jìn)行了同步操作。在同步的過(guò)程中又有一塊磁盤指示燈報(bào)警,磁盤離線,磁盤陣列同步失敗,raid5陣列崩潰,存儲(chǔ)無(wú)法正常工作。
北亞企安數(shù)據(jù)恢復(fù)工程師對(duì)故障存儲(chǔ)中的物理磁盤狀態(tài)進(jìn)行了檢測(cè),經(jīng)過(guò)檢測(cè)發(fā)現(xiàn)該raid5磁盤陣列中先離線的硬盤訪問(wèn)速度極為緩慢,第二塊離線的磁盤有少量壞扇區(qū),其他磁盤無(wú)明顯物理故障。
該raid5磁盤陣列只包含一個(gè)卷組,該卷組占用陣列全部空間,該卷組只有一個(gè)起始位置為0扇區(qū)的XFS裸分區(qū)。
RAID5陣列只支持一塊磁盤的錯(cuò)誤冗余功能,當(dāng)?shù)诙K磁盤離線后陣列便無(wú)法正常工作,所以整個(gè)陣列的崩潰主要是由于第二塊磁盤的離線造成的。第二塊磁盤是否能處理好是數(shù)據(jù)恢復(fù)的關(guān)鍵。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、對(duì)故障存儲(chǔ)中15塊硬盤進(jìn)行異或測(cè)試,所有磁盤全部通過(guò)測(cè)試,沒(méi)有發(fā)現(xiàn)明顯錯(cuò)誤。
2、以只讀方式鏡像備份所有完好的磁盤數(shù)據(jù),后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免在數(shù)據(jù)恢復(fù)過(guò)程中對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
3、對(duì)第二塊離線的硬盤進(jìn)行單獨(dú)備份,備份過(guò)程中略過(guò)壞扇區(qū)。計(jì)算第二塊硬盤損壞扇區(qū)位置的數(shù)據(jù),并將其寫入鏡像文件。
4、基于鏡像文件分析原RAID5陣列結(jié)構(gòu)信息,根據(jù)分析獲取到的raid相關(guān)信息構(gòu)建RAID5陣列。
5、重構(gòu)RAID后驗(yàn)證RAID結(jié)構(gòu)是否正確。
6、將第二塊磁盤的鏡像備份到新硬盤,并將其強(qiáng)制上線。更換第一塊磁盤并對(duì)其進(jìn)行同步。
7、完成上述操作后,由用戶方工程師親自對(duì)恢復(fù)出來(lái)的數(shù)據(jù)進(jìn)行檢測(cè),經(jīng)過(guò)反復(fù)檢測(cè),用戶方確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)完整有效。
服務(wù)器數(shù)據(jù)恢復(fù)總結(jié):
因?yàn)楣收洗鎯?chǔ)中所有硬盤的異或測(cè)試全部通過(guò),這意味著存儲(chǔ)發(fā)生故障后沒(méi)有新數(shù)據(jù)的寫入或者結(jié)構(gòu)的改動(dòng)。在這種情況下可以根據(jù)其他幾塊完好的硬盤計(jì)算出壞硬盤對(duì)應(yīng)位置的數(shù)據(jù)。恢復(fù)完成后進(jìn)行檢查,目錄結(jié)構(gòu)完整,重要文檔完好,F(xiàn)SCK無(wú)任何錯(cuò)誤提示,用戶認(rèn)可所恢復(fù)的數(shù)據(jù)。
審核編輯:湯梓紅
-
存儲(chǔ)
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85854 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
573瀏覽量
17460 -
RAID5
+關(guān)注
關(guān)注
0文章
120瀏覽量
12727
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論