服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
HP某型號(hào)服務(wù)器,5塊硬盤組建了一組raid5磁盤陣列。
服務(wù)器故障&分析:
服務(wù)器在工作過程中,raid5磁盤陣列中的一塊磁盤掉線,由于raid5的容錯(cuò)特點(diǎn),raid陣列未受影響,工作人員也沒有及時(shí)關(guān)注磁盤離線的問題。服務(wù)器繼續(xù)運(yùn)行一段時(shí)間后出現(xiàn)故障,管理員將現(xiàn)有的4塊磁盤進(jìn)行了重建raid的操作,重建后進(jìn)行了數(shù)據(jù)同步,原raid5陣列中的數(shù)據(jù)全部丟失。
HP SMART ARRAY在創(chuàng)建一組新的RAID5時(shí),默認(rèn)會(huì)全盤重建所有的塊校驗(yàn)。這意味著在組成新創(chuàng)建RAID5的任一條帶中,總有一個(gè)校驗(yàn)塊的數(shù)據(jù)是在創(chuàng)建raid時(shí)生成的,這個(gè)特性對(duì)于原raid陣列來(lái)說是極具破壞性的。
經(jīng)過分析,后生成的4盤RAID5組成結(jié)構(gòu)是雙循環(huán)、64K塊大小、16次條帶換校驗(yàn)。這意味著新組建raid5的4塊成員盤中,每隔3M就會(huì)有1M的數(shù)據(jù)是錯(cuò)誤的。原5盤RAID5的組成結(jié)構(gòu)為雙循環(huán)、塊大小128K、16次條帶換校驗(yàn)。
要想恢復(fù)數(shù)據(jù)必須修復(fù)早掉線的那塊硬盤,數(shù)據(jù)恢復(fù)率取決于早掉線磁盤掉線之后數(shù)據(jù)變更多少。
最終敲定的數(shù)據(jù)恢復(fù)方案:對(duì)新舊raid5組成結(jié)構(gòu)的差異性進(jìn)行分析,用之前掉線的盤重新補(bǔ)回重建RAID時(shí)被破壞的校驗(yàn)信息,再虛擬重組RAID并解釋文件系統(tǒng),然后導(dǎo)出文件。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器中所有涉及到的硬盤以只讀方式進(jìn)行全盤鏡像,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成再次的破壞。
2、基于鏡像文件分析所有磁盤底層數(shù)據(jù),根據(jù)破壞前后的數(shù)據(jù)痕跡分析新舊RAID5的結(jié)構(gòu)。
3、分析新舊raid5組成結(jié)構(gòu)差異,北亞企安數(shù)據(jù)恢復(fù)工程師編寫校驗(yàn)修正程序。按原RAID5結(jié)構(gòu)虛擬重組RAID,生成鏡像文件。
4、由北亞企安數(shù)據(jù)恢復(fù)工程師修正重組后的鏡像文件系統(tǒng)錯(cuò)誤(所幸硬盤離線后數(shù)據(jù)變更很少,錯(cuò)誤極少)。
5、導(dǎo)出部分分區(qū)數(shù)據(jù),將部分分區(qū)在無(wú)錯(cuò)誤的前提下完全鏡像到準(zhǔn)備好的新空間。
6、經(jīng)過數(shù)據(jù)恢復(fù)工程師和用戶方工程師的嚴(yán)格測(cè)試,確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)完整有效。
審核編輯黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9160瀏覽量
85427 -
RAID
+關(guān)注
關(guān)注
0文章
278瀏覽量
35098 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
573瀏覽量
17458
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論