服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
華為OceanStor某型號存儲,十幾塊FC硬盤組建一組RAID5磁盤陣列,配備了一塊熱備盤;上層使用EXT3文件系統(tǒng),配置了oracle數(shù)據(jù)庫。
服務(wù)器故障:
該存儲RAID5中的一塊硬盤未知原因離線,熱備盤上線開始同步數(shù)據(jù),同步未完成時候又有一塊磁盤未知原因離線,數(shù)據(jù)同步失敗,raid5癱瘓,上層lun不可用。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、將故障存儲中所有磁盤編號后取出進(jìn)行物理故障檢測,檢測后發(fā)現(xiàn)為先掉線的磁盤存在物理故障,其他磁盤包括后掉線的那塊磁盤均無物理故障。
2、將所有磁盤以只讀方式做全盤鏡像,后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)恢復(fù)操作都基于鏡像文件進(jìn)行,避免對原始磁盤數(shù)據(jù)造成二次影響。
3、基于鏡像文件分析raid5中的所有磁盤底層數(shù)據(jù),找出熱備盤。raid是條帶化的,陣列中的數(shù)據(jù)是按照一定的規(guī)律進(jìn)行存儲的。數(shù)據(jù)恢復(fù)工程師分析raid中的數(shù)據(jù)庫頁在每一個物理磁盤中的分布情況,計算出raid5的磁盤順序、數(shù)據(jù)走向、條帶大小等RAID相關(guān)信息。
4、根據(jù)分析出來的RAID相關(guān)信息,使用北亞企安自主開發(fā)的RAID重構(gòu)程序?qū)⒃糝AID虛擬重構(gòu)出來。但由于原始RAID5中掉線了2塊盤且有1塊盤的數(shù)據(jù)被同步破壞,分析每一塊硬盤中的數(shù)據(jù)后發(fā)現(xiàn)有一塊硬盤在同一個條帶上的數(shù)據(jù)和其他硬盤明顯不一致,初步判斷此盤是被同步破壞的硬盤。通過北亞企安自主開發(fā)的RAID校驗程序校驗這個條帶,最終確定被同步損壞的磁盤。
5、分析lun在raid5中的分配狀態(tài)和lun分配的數(shù)據(jù)塊,根據(jù)數(shù)據(jù)MAP導(dǎo)出LUN的數(shù)據(jù)。
6、由于使用了熱備盤虛擬重構(gòu)RAID,EXT3文件系統(tǒng)無法正常掛載。
7、提取oracle數(shù)據(jù)庫文件,使用北亞企安自主開發(fā)的文件系統(tǒng)解析程序?qū)ζ溥M(jìn)行文件系統(tǒng)解析,然后導(dǎo)出oracle數(shù)據(jù)庫文件。
8、將導(dǎo)出的數(shù)據(jù)庫文件移交給數(shù)據(jù)庫工程師進(jìn)行校驗和驗證。使用Oracle數(shù)據(jù)庫文件檢測工具檢測每個數(shù)據(jù)庫文件的完整性。如果發(fā)現(xiàn)錯誤,使用北亞企安自主研發(fā)的Oracle數(shù)據(jù)庫檢測工具進(jìn)行二次檢測。檢測后發(fā)現(xiàn)部分?jǐn)?shù)據(jù)庫文件和日志文件錯誤,system和sysaux表空間都存在壞塊,控制文件全部損壞;eschoolspace表空間的幾個文件存在的壞塊更多;undotbs02丟失;數(shù)據(jù)庫數(shù)據(jù)恢復(fù)工程師對這些文件進(jìn)行修復(fù)。
北亞企安數(shù)據(jù)恢復(fù)——OceanStor存儲數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)——OceanStor存儲數(shù)據(jù)恢復(fù)
北亞企安數(shù)據(jù)恢復(fù)——OceanStor存儲數(shù)據(jù)恢復(fù)
9、修復(fù)完成后,由用戶方配合,啟動Oracle數(shù)據(jù)庫。在本地虛擬機安裝OA客戶端,通過OA客戶端對數(shù)據(jù)記錄進(jìn)行驗證。用戶方安排不同部門人員進(jìn)行遠(yuǎn)程驗證,經(jīng)過反復(fù)驗證,確認(rèn)數(shù)據(jù)完整有效。本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯:湯梓紅
-
華為
+關(guān)注
關(guān)注
216文章
34440瀏覽量
251770 -
存儲
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85853 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
573瀏覽量
17460 -
磁盤
+關(guān)注
關(guān)注
1文章
379瀏覽量
25209
發(fā)布評論請先 登錄
相關(guān)推薦
評論