服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
NetApp某型號存儲;
配備SAS硬盤,該硬盤520字節(jié)一個扇區(qū);
所有的lun映射到小型機使用,存放Oracle數(shù)據(jù)庫文件,采用ASM裸設(shè)備存儲方式。
服務(wù)器故障:
管理員誤操作刪除NetApp存儲上的所有l(wèi)un。和管理員溝通后得知:因為業(yè)務(wù)變化,需要重新規(guī)劃存儲空間,管理員直接把存儲卷全部刪除并重新分配。在執(zhí)行刪除操作之后還沒有來得及分配的時候,上層業(yè)務(wù)突然宕機了。運維工程師緊急排查故障情況,發(fā)現(xiàn)業(yè)務(wù)服務(wù)器上的磁盤都不見了,無法訪問數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
1、為了避免在數(shù)據(jù)恢復(fù)過程中對原始數(shù)據(jù)造成二次破壞,把故障存儲中的每塊磁盤以只讀方式做完全鏡像,后續(xù)的所有數(shù)據(jù)恢復(fù)操作都在鏡像文件上進行。
2、分析Netapp存儲的存儲過程。
a、分析盤序和LVM的組成方式。
b、掃描硬盤內(nèi)的所有節(jié)點。
c、在節(jié)點掃描結(jié)果中找到文件大小符合需求的節(jié)點并提取此節(jié)點。
d、根據(jù)索引根內(nèi)的第一級數(shù)據(jù)指針提取本文件的所有直接數(shù)據(jù)指針,在指針提取完畢后開始提取文件數(shù)據(jù)。
3、在硬盤前面的扇區(qū)位置查找超級塊的相關(guān)信息。
netapp超級塊信息:
北亞企安數(shù)據(jù)恢復(fù)——NetApp數(shù)據(jù)恢復(fù)
數(shù)據(jù)塊有數(shù)據(jù)塊描述信息,根據(jù)這些信息可以判斷出哪些磁盤是校驗盤(提取數(shù)據(jù)時需剔除)。
校驗塊描述信息:
北亞企安數(shù)據(jù)恢復(fù)——NetApp數(shù)據(jù)恢復(fù)
4、根據(jù)每塊磁盤的磁盤信息以及磁盤的RAID盤序表確定盤序。首先要確定各個磁盤所屬aggr組,然后再判斷組內(nèi)盤序。
netapp盤序表:
北亞企安數(shù)據(jù)恢復(fù)——NetApp數(shù)據(jù)恢復(fù)
5、Netapp的節(jié)點分布在數(shù)量眾多的數(shù)據(jù)塊內(nèi),在數(shù)據(jù)塊內(nèi)節(jié)點又被統(tǒng)一組織為節(jié)點組。每個節(jié)點組的部分字節(jié)記錄一些系統(tǒng)數(shù)據(jù),部分字節(jié)為一項來記錄各個文件節(jié)點。根據(jù)用戶級別文件節(jié)點可分為兩類:系統(tǒng)文件節(jié)點和用戶文件節(jié)點。
netapp節(jié)點:
北亞企安數(shù)據(jù)恢復(fù)——NetApp數(shù)據(jù)恢復(fù)
6、獲取目錄項,根據(jù)其節(jié)點編號找到對應(yīng)節(jié)點。
目錄項信息:
北亞企安數(shù)據(jù)恢復(fù)——NetApp數(shù)據(jù)恢復(fù)
7、分析好存儲結(jié)構(gòu)之后,使用北亞企安自研的NetApp解析程序提取數(shù)據(jù),解析asm文件系統(tǒng)并提取出數(shù)據(jù)庫文件。
北亞企安數(shù)據(jù)恢復(fù)——NetApp數(shù)據(jù)恢復(fù)
8、搭建小機環(huán)境,安裝oracle數(shù)據(jù)庫,驗證數(shù)據(jù)庫文件和備份文件。
a、檢測數(shù)據(jù)庫文件。使用提取出的數(shù)據(jù)庫文件啟動數(shù)據(jù)庫,可以正常啟動。
b、檢測數(shù)據(jù)庫備份文件。篩選出最新的數(shù)據(jù)庫備份文件,使用篩選出的備份文件還原數(shù)據(jù)庫,經(jīng)過逐一嘗試,沒有發(fā)現(xiàn)問題。用戶親自驗證后確認數(shù)據(jù)庫恢復(fù)確認無誤,本次數(shù)據(jù)恢復(fù)工作完成。
審核編輯黃宇
-
存儲
+關(guān)注
關(guān)注
13文章
4314瀏覽量
85851 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
573瀏覽量
17458
發(fā)布評論請先 登錄
相關(guān)推薦
評論