服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
服務(wù)器中有一組由6塊磁盤組建的RAID6磁盤陣列。服務(wù)器作為WEB服務(wù)器使用,上面運(yùn)行了MYSQL數(shù)據(jù)庫(kù)以及存放了網(wǎng)站代碼和其他數(shù)據(jù)文件。
服務(wù)器故障:
在服務(wù)器運(yùn)行過程中該raid6陣列中有兩塊磁盤先后離線,但是管理員沒有注意到這個(gè)問題,沒有及時(shí)更換磁盤。當(dāng)該raid6陣列中的第三塊磁盤離線時(shí)該raid6陣列崩潰,服務(wù)器中的數(shù)據(jù)全部丟失。用戶方在故障發(fā)生后立即讓當(dāng)?shù)財(cái)?shù)據(jù)恢復(fù)服務(wù)商恢復(fù)數(shù)據(jù)。經(jīng)過該數(shù)據(jù)恢復(fù)服務(wù)商的操作后,仍有近一個(gè)月的數(shù)據(jù)沒有恢復(fù)出來,MYSQL數(shù)據(jù)庫(kù)嚴(yán)重?fù)p壞。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器raid6磁盤陣列中的6塊磁盤以只讀方式全盤鏡像備份到北亞企安數(shù)據(jù)恢復(fù)中心的存儲(chǔ)池中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤數(shù)據(jù)造成二次破壞。鏡像完成后將所有磁盤按照原樣還原到故障服務(wù)器中。
2、基于鏡像文件分析后。發(fā)現(xiàn)最先離線的兩塊離線磁盤其實(shí)很早就已經(jīng)離線,很長(zhǎng)一段時(shí)間已經(jīng)沒有寫入新的數(shù)據(jù)了。
3、基于鏡像文件對(duì)底層數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)故障RAID6陣列采用的是雙校驗(yàn):第一個(gè)校驗(yàn)是由普通的XOR運(yùn)算生成,而第二個(gè)校驗(yàn)是由Reed-Solomon算法生成。
4、故障服務(wù)器RAID6陣列中兩塊早離線的磁盤已經(jīng)很長(zhǎng)一段時(shí)間不寫入新數(shù)據(jù)了,所以要想完整恢復(fù)數(shù)據(jù)就必須運(yùn)用第二個(gè)由Reed-Solomon算法生成的校驗(yàn),否則會(huì)導(dǎo)致最新的數(shù)據(jù)丟失。當(dāng)時(shí)行業(yè)中還沒有現(xiàn)成的數(shù)據(jù)恢復(fù)類軟件能解決這個(gè)問題,雖然有部分軟件設(shè)計(jì)了這一功能,但只是擺設(shè)而已。這也就是之前這家數(shù)據(jù)恢復(fù)服務(wù)商沒能夠完整恢復(fù)所有數(shù)據(jù)的原因所在。
5、北亞企安數(shù)據(jù)恢復(fù)工程師分析出原RAID6的結(jié)構(gòu)等相關(guān)參數(shù),使用北亞企安自主編寫的RAID6恢復(fù)軟件生成出一個(gè)完整鏡像。將生成的鏡像導(dǎo)回用戶方用新磁盤搭建好的服務(wù)器環(huán)境中,開機(jī)一切正常。
北亞企安數(shù)據(jù)恢復(fù)——raid6數(shù)據(jù)恢復(fù)
6、經(jīng)過用戶方的多方面反復(fù)驗(yàn)證,確認(rèn)恢復(fù)出來的數(shù)據(jù)完整有效,沒有任何問題。本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9160瀏覽量
85425 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
573瀏覽量
17457
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論