服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
北京某公司的一臺服務(wù)器,有一組由3塊磁盤組建的raid5磁盤陣列。
服務(wù)器故障:
服務(wù)器在正常運行過程中突然癱瘓。用戶方致電我們數(shù)據(jù)恢復(fù)中心尋求幫助,數(shù)據(jù)恢復(fù)工程師達到現(xiàn)場對故障服務(wù)器進行了檢測,發(fā)現(xiàn)導(dǎo)致服務(wù)器癱瘓的原因是服務(wù)器中一塊硬盤由于未知故障離線,存儲有重要數(shù)據(jù)的分區(qū)無法識別。
經(jīng)過和用戶方管理員溝通得知:在北亞企安工程師到現(xiàn)場之前,服務(wù)器管理員已經(jīng)對故障服務(wù)器進行過一系列救援數(shù)據(jù)的操作。管理員在發(fā)現(xiàn)服務(wù)器癱瘓后就重啟服務(wù)器,故障硬盤重新上線開始同步數(shù)據(jù),數(shù)據(jù)同步到40%左右的時候,管理員感覺異常就強制關(guān)機。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障服務(wù)器內(nèi)所有硬盤編號取出,連接到北亞企安數(shù)據(jù)恢復(fù)平臺上,以只讀模式對所有硬盤進行鏡像備份。備份完成后按照原樣把所有硬盤還原到故障服務(wù)器中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進行,避免對原始數(shù)據(jù)造成二次破壞。
2、基于鏡像文件對所有硬盤底層數(shù)據(jù)進行分析,獲取到該raid5磁盤陣列相關(guān)信息。
3、根據(jù)raid相關(guān)信息重組raid結(jié)構(gòu)并進行抑或校驗,結(jié)果只有部分數(shù)據(jù)通過校驗。經(jīng)過服務(wù)器數(shù)據(jù)恢復(fù)工程師分析,發(fā)生這種情況是因為離線硬盤重新上線后的同步操作對數(shù)據(jù)造成破壞。北亞企安數(shù)據(jù)恢復(fù)工程師嘗試不同方案,但最終提取出來的數(shù)據(jù)都是損壞的,只能嘗試是否能修復(fù)成功。
4、對存儲重要數(shù)據(jù)的分區(qū)進行掃描和分析,該分區(qū)的數(shù)據(jù)文件目錄不可見。只能對自由空間數(shù)據(jù)頁進行掃描并由北亞企安數(shù)據(jù)恢復(fù)工程師進行碎片分析和重組。對重組出的文件進行完整度和有效性的驗證,驗證通過后提取數(shù)據(jù)。
5、用戶通過上層應(yīng)用連接數(shù)據(jù)庫對提取出來的數(shù)據(jù)進行可用性驗證。經(jīng)過反復(fù)驗證,數(shù)據(jù)庫文件可以正常加載,上層應(yīng)用使用正常。本次服務(wù)器數(shù)據(jù)恢復(fù)工作完成。
服務(wù)器數(shù)據(jù)恢復(fù)Tip:
當服務(wù)器由于未知原因故障而導(dǎo)致系統(tǒng)崩潰或者文件不識別/不可用時,通常不建議盲目地在服務(wù)器上進行數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作。如果確實對自己的數(shù)據(jù)恢復(fù)技術(shù)有自信,必須先對原服務(wù)器的所有硬盤數(shù)據(jù)進行鏡像備份,數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作只能在鏡像文件上進行,避免操作失誤破壞原始數(shù)據(jù),讓后續(xù)的數(shù)據(jù)恢復(fù)難度增加。
審核編輯黃宇
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9215瀏覽量
85574 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
578瀏覽量
17500
發(fā)布評論請先 登錄
相關(guān)推薦
評論