服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
某單位一臺(tái)服務(wù)器上有一組raid5陣列,該raid5陣列有15塊成員盤(pán)。上層是一個(gè)xfs裸分區(qū),起始位置是0扇區(qū)。
服務(wù)器故障&檢測(cè):
服務(wù)器raid5陣列中有硬盤(pán)性能表現(xiàn)不穩(wěn)定,但是由于管理員長(zhǎng)時(shí)間沒(méi)有關(guān)注服務(wù)器的運(yùn)行狀態(tài),沒(méi)有及時(shí)發(fā)現(xiàn)這個(gè)問(wèn)題,終于有磁盤(pán)出現(xiàn)故障掉線。raid5陣列上的熱備盤(pán)替換掉線硬盤(pán),在上線同步數(shù)據(jù)的過(guò)程中又有其他硬盤(pán)掉線,數(shù)據(jù)同步過(guò)程中斷,raid5陣列崩潰,導(dǎo)致服務(wù)器數(shù)據(jù)丟失。
北亞企安數(shù)據(jù)恢復(fù)工程師將故障服務(wù)器中所有磁盤(pán)編號(hào)后取出,由硬件工程師對(duì)每塊磁盤(pán)進(jìn)行硬件故障檢測(cè),發(fā)現(xiàn)先離線的硬盤(pán)中存在大量的壞道,后掉線的硬盤(pán)中也存在少量壞道。沒(méi)有掉線的其他硬盤(pán)均沒(méi)有發(fā)現(xiàn)物理故障。
這是一個(gè)典型的raid5陣列熱備盤(pán)在同步數(shù)據(jù)過(guò)程中出現(xiàn)其他硬盤(pán)掉線,從而導(dǎo)致raid陣列崩潰的案例。針對(duì)這種情況,最便捷的恢復(fù)服務(wù)器數(shù)據(jù)的方法就是修復(fù)后掉線的那塊硬盤(pán)的物理故障,將后掉線的這塊硬盤(pán)內(nèi)的數(shù)據(jù)恢復(fù)出來(lái),然后重組raid陣列即可恢復(fù)服務(wù)器的數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過(guò)程:
1、將故障服務(wù)器中其他無(wú)物理故障的磁盤(pán)以只讀方式做扇區(qū)級(jí)別的全盤(pán)鏡像備份,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對(duì)原始磁盤(pán)數(shù)據(jù)造成二次破壞。
將后掉線的那塊硬盤(pán)使用專(zhuān)業(yè)工具處理后進(jìn)行了備份,由于這塊硬盤(pán)中存在著壞扇區(qū),部分?jǐn)?shù)據(jù)無(wú)法讀取,北亞企安數(shù)據(jù)恢復(fù)工程師手動(dòng)查看底層數(shù)據(jù)并根據(jù)異或規(guī)律計(jì)算壞扇區(qū)位置的數(shù)據(jù)并手動(dòng)寫(xiě)入。
2、基于鏡像文件分析底層數(shù)據(jù)獲取raid5結(jié)構(gòu)相關(guān)信息,根據(jù)獲取到的信息虛擬重組riad并驗(yàn)證riad5結(jié)構(gòu)的正確性。
3、利用鏡像好的后掉線的硬盤(pán)進(jìn)行數(shù)據(jù)同步。
4、數(shù)據(jù)同步結(jié)束后由工程師驗(yàn)數(shù)據(jù)的正確性,驗(yàn)證無(wú)誤后交由用戶(hù)方工程師驗(yàn)證。經(jīng)過(guò)用戶(hù)方工程師的反復(fù)驗(yàn)證,確認(rèn)恢復(fù)出來(lái)的數(shù)據(jù)目錄結(jié)構(gòu)完整,數(shù)據(jù)可用,程序無(wú)報(bào)錯(cuò)且運(yùn)行正常。本次數(shù)據(jù)恢復(fù)工作完成。
服務(wù)器數(shù)據(jù)安全Tips:
Raid5磁盤(pán)陣列的安全性相對(duì)較高,但依然會(huì)出現(xiàn)數(shù)據(jù)丟失的情況。只有定期維護(hù),及時(shí)檢修,更換老舊、不穩(wěn)定的硬盤(pán),才能盡可能的避免發(fā)生數(shù)據(jù)災(zāi)難。
審核編輯:湯梓紅
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9262瀏覽量
85782 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
584瀏覽量
17557 -
RAID5
+關(guān)注
關(guān)注
0文章
122瀏覽量
12749
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論