服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
一臺(tái)網(wǎng)站服務(wù)器中有一組由6塊磁盤組建的RAID6磁盤陣列,操作系統(tǒng)層面運(yùn)行MySQL數(shù)據(jù)庫和存放一些其他類型文件。
服務(wù)器故障:
該服務(wù)器在工作過程中,raid6磁盤陣列中有兩塊磁盤先后離線,不知道是管理員沒有注意或者沒有重視這個(gè)情況,沒有為該raid6磁盤陣列更換離線磁盤。當(dāng)?shù)谌龎K硬盤離線后,該raid6陣列崩潰,服務(wù)器癱瘓,該服務(wù)器上跑的業(yè)務(wù)停擺。如果更換硬盤重新組建陣列,則陣列中的所有數(shù)據(jù)會(huì)全部丟失。
服務(wù)器管理員嘗試通過市面上比較流行的數(shù)據(jù)恢復(fù)軟件對(duì)服務(wù)器中的數(shù)據(jù)進(jìn)行搶救,但是仍有大部分?jǐn)?shù)據(jù)丟失無法恢復(fù)。管理員求助我們數(shù)據(jù)恢復(fù)中心,要求恢復(fù)服務(wù)器中所有數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器內(nèi)所有硬盤編號(hào)后取出,經(jīng)過硬件工程師檢測(cè)沒有發(fā)現(xiàn)有硬盤存在明顯的硬件故障,都可以正常讀取數(shù)據(jù)。以只讀方式將所有磁盤進(jìn)行扇區(qū)級(jí)別的全盤鏡像,鏡像完成后按照編號(hào)將所有磁盤還原到原服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。
2、服務(wù)器磁盤陣列中3塊硬盤同時(shí)掉線的概率可以忽略不計(jì),要恢復(fù)磁盤陣列中的數(shù)據(jù)首先需要搞清楚這幾塊硬盤離線的先后順序,找到最后離線的硬盤。如果最后離線的那塊硬盤存在硬件故障則修復(fù)硬件故障,然后提取數(shù)據(jù)。根據(jù)該raid陣列的存儲(chǔ)結(jié)構(gòu)分析raid結(jié)構(gòu)參數(shù),然后利用這些參數(shù)重組raid。
3、本案例服務(wù)器中的raid6磁盤陣列使用的是雙校驗(yàn)?zāi)J剑旱谝粋€(gè)校驗(yàn)方式是普通的oxr(異或運(yùn)算),第二個(gè)校驗(yàn)方式是reed-solmon算法。一般情況下通過第一個(gè)校驗(yàn)方式即可恢復(fù)數(shù)據(jù),但是本案例中radi6陣列中的前兩塊離線硬盤很早之前就已經(jīng)掉線,不具備數(shù)據(jù)恢復(fù)的條件,所以無法通過第一種校驗(yàn)方式來恢復(fù)數(shù)據(jù)。第二種校驗(yàn)方式比較復(fù)雜,所以管理員通過市面上常用的數(shù)據(jù)恢復(fù)軟件恢復(fù)出來的數(shù)據(jù)大量缺失,且數(shù)據(jù)庫無法使用。
4、北亞企安數(shù)據(jù)恢復(fù)中心工程師團(tuán)隊(duì)對(duì)reed-solomon算法進(jìn)行過技術(shù)攻關(guān),擁有通過reed-solomon算法恢復(fù)數(shù)據(jù)的實(shí)際案例經(jīng)驗(yàn)。經(jīng)過一番努力,北亞企安數(shù)據(jù)恢復(fù)工程師通過分析獲取到該raid6磁盤陣列的關(guān)鍵參數(shù)并提取出完整的鏡像數(shù)據(jù)。
5、經(jīng)過用戶方管理員的驗(yàn)證,確認(rèn)所有數(shù)據(jù)成功恢復(fù),數(shù)據(jù)庫可以使用,本次服務(wù)器數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9160瀏覽量
85428 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
573瀏覽量
17458 -
RAID6
+關(guān)注
關(guān)注
0文章
9瀏覽量
5934
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論