服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
某品牌2850服務(wù)器中有一組由6塊SCSI硬盤組建的raid5磁盤陣列,linux操作系統(tǒng)+ext3文件系統(tǒng)。
服務(wù)器故障:
服務(wù)器運行過程中突然癱瘓。服務(wù)器管理員檢查陣列后發(fā)現(xiàn)raid5陣列中有兩塊硬盤離線,將其中一塊硬盤進行強制上線操作,但是服務(wù)器操作系統(tǒng)啟動異常。這時,管理員意識到問題的嚴重性,馬上將服務(wù)器關(guān)機,聯(lián)系到我們數(shù)據(jù)恢復(fù)中心尋求幫助。
raid5陣列兩塊硬盤離線的故障情況十分常見,由于raid5磁盤陣列支持一塊硬盤離線時的冗余保護,如果出現(xiàn)多塊硬盤離線的情況,服務(wù)器便處于癱瘓狀態(tài),且離線硬盤不會自動上線。由于目前市面上主流品牌的raid控制器的磁盤監(jiān)控策略比較嚴格,陣列中硬盤掉線很多是由電源波動、控制器bug等隨機原因所導(dǎo)致,所以掉線盤很有可能沒有比較嚴重的物理故障。但是硬盤掉線后的強制上線操作風(fēng)險性是很大的,一旦上線出錯就會導(dǎo)致控制器對數(shù)據(jù)造成一些不可逆的損壞。進入操作系統(tǒng)后因為文件系統(tǒng)不一致進行自動修復(fù),導(dǎo)致服務(wù)器中所有硬盤數(shù)據(jù)不一致,數(shù)據(jù)恢復(fù)難度很大。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器中所有磁盤編號后取出,以只讀方式進行扇區(qū)級全盤鏡像,鏡像過程中發(fā)現(xiàn)多塊硬盤存在壞道但沒有下線,應(yīng)該是raid還沒有識別到這些硬盤上的壞道。鏡像完成后將所有磁盤按照編號還原到原服務(wù)器中,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
2、基于鏡像文件分析故障服務(wù)器中的raid結(jié)構(gòu)信息,利用獲取到的raid結(jié)構(gòu)信息虛擬重構(gòu)raid并驗證raid結(jié)構(gòu)的正確性。北亞企安數(shù)據(jù)恢復(fù)工程師人工修正被破壞結(jié)構(gòu),將修正后的數(shù)據(jù)導(dǎo)出到一臺存儲上臨時存放。
3、使用完好的硬盤在服務(wù)器上搭建新的raid5磁盤陣列,將恢復(fù)出的數(shù)據(jù)遷移到新搭建的raid中。經(jīng)過檢驗,恢復(fù)出來的數(shù)據(jù)一切正常,本次數(shù)據(jù)恢復(fù)工作結(jié)束。
Tips:
一旦出現(xiàn)raid5磁盤陣列中多塊硬盤離線導(dǎo)致服務(wù)器癱瘓的情況,切記不要盲目進行強制上線操作。首先要做的就是將源硬盤全部鏡像,可以在WINDOWS環(huán)境下執(zhí)行如下操作:
1、可用相同或大于源盤容量的硬盤作為目標盤,將源盤全部扇區(qū)方式CLONE到目標盤。將所有盤做同樣操作。
2、可將每塊源盤完全以扇區(qū)方式輸出文件到某大容量存儲空間(如大容量硬盤、NAS、SAN、DAS等)。
審核編輯 黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9432瀏覽量
86508 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
596瀏覽量
17792 -
磁盤
+關(guān)注
關(guān)注
1文章
383瀏覽量
25375 -
RAID5
+關(guān)注
關(guān)注
0文章
124瀏覽量
12832
發(fā)布評論請先 登錄
相關(guān)推薦
服務(wù)器數(shù)據(jù)恢復(fù)—華為OceanStor存儲中RAID5陣列數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—用5盤RAID5陣列中的4塊盤重建RAID5陣列后如何恢復(fù)原始數(shù)據(jù)?
服務(wù)器數(shù)據(jù)恢復(fù)—RAID5陣列硬盤離線但熱備盤未激活的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤上線同步失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—不當(dāng)操作導(dǎo)致raid5陣列數(shù)據(jù)無法恢復(fù)的案例
服務(wù)器數(shù)據(jù)恢復(fù)—硬盤離線導(dǎo)致Raid5陣列熱備盤上線失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤同步失敗的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列熱備盤未完全激活導(dǎo)致陣列崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—EMC存儲中raid5陣列多塊硬盤離線的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列硬盤壞道導(dǎo)致raid崩潰的數(shù)據(jù)恢復(fù)案例
服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列上層文件夾丟失的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—磁盤不穩(wěn)定被踢導(dǎo)致raid5陣列崩潰的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—磁盤離線但熱備盤未完全啟用導(dǎo)致raid5陣列崩潰的數(shù)據(jù)恢復(fù)案例

服務(wù)器數(shù)據(jù)恢復(fù)—raid5陣列硬盤離線且熱備盤未激活的數(shù)據(jù)恢復(fù)案例

評論