服務器故障&分析:
某銀行的某一業(yè)務模塊崩潰,無法正常使用。排查服務器故障,發(fā)現(xiàn)運行該業(yè)務模塊的服務器中多塊硬盤離線,導致上層應用崩潰。
故障服務器內多塊硬盤掉線,硬盤掉線數(shù)量超過服務器raid陣列冗余級別所允許的硬盤掉線數(shù)量,導致服務器癱瘓??梢酝ㄟ^修復硬盤物理故障,提取故障盤數(shù)據(jù)后重組raid的方案來恢復服務器數(shù)據(jù)。
服務器數(shù)據(jù)恢復過程:
1、將故障服務器中所有磁盤編號后取出。北亞企安數(shù)據(jù)恢復工程師對服務器進行了初檢,發(fā)現(xiàn)故障服務器13塊硬盤中的4塊處于離線狀態(tài)。
2、由硬件工程師對離線硬盤進行物理故障檢測,檢測后發(fā)現(xiàn)掉線硬盤中均存在大量壞道。北亞企安硬件工程師對存在壞道的掉線硬盤進行了物理修復,然后以只讀方式給這些硬盤和其他完好的硬盤做全盤鏡像。鏡像完成后將所有硬盤按照編號還原到原服務器中。后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復操作都基于鏡像文件進行,避免對原始磁盤數(shù)據(jù)造成二次破壞。
3、基于鏡像文件分析服務器中的raid結構,北亞企安數(shù)據(jù)恢復工程師利用分析獲取到的raid相關信息虛擬重組raid陣列,重組完成后驗證磁盤陣列的可用性。
4、如果驗證不通過則重新分析raid結構并調整參數(shù)重組raid陣列,直到驗證數(shù)據(jù)可用沒有問題。
5、將恢復好的數(shù)據(jù)交由用戶方驗證,經(jīng)過驗證后用戶方認可恢復結果。本次數(shù)據(jù)恢復工作完成。
Tips:
1、服務器出現(xiàn)故障后,切忌再對服務器進行任何操作,不要隨意取出硬盤,以免弄亂硬盤順序,增加后期數(shù)據(jù)恢復的難度。
2、如果必須取出硬盤,請?zhí)崆皹擞浐糜脖P的順序。
3、求助專業(yè)服務器數(shù)據(jù)恢復機構。
4、如果服務器內存儲的是保密度較高、較為重要的數(shù)據(jù)資料,建議配備服務器數(shù)據(jù)恢復設備,防止在數(shù)據(jù)恢復過程中造成數(shù)據(jù)丟失或泄露。
審核編輯:湯梓紅
-
硬盤
+關注
關注
3文章
1310瀏覽量
57313 -
服務器
+關注
關注
12文章
9160瀏覽量
85421 -
數(shù)據(jù)恢復
+關注
關注
10文章
573瀏覽量
17452
發(fā)布評論請先 登錄
相關推薦
評論