服務(wù)器數(shù)據(jù)恢復(fù)環(huán)境:
IBM某型號服務(wù)器中6塊硬盤搭建的raid5磁盤陣列,其中1塊盤作為熱備盤使用。
上層部署的是SAP應(yīng)用+Oracle數(shù)據(jù)庫。
服務(wù)器故障&檢測:
服務(wù)器中RAID5磁盤陣列中的1塊盤出現(xiàn)故障離線,熱備盤激活替換離線硬盤,在進(jìn)行數(shù)據(jù)同步的過程中又有一塊硬盤故障離線,RAID5磁盤陣列癱瘓,上層LUN不可用,服務(wù)器崩潰。
IBM服務(wù)器中的LUN是基于RAID組的。分析故障raid5中的所有硬盤,發(fā)現(xiàn)其中一塊盤的數(shù)據(jù)同其它盤有明顯不同,初步判斷這塊盤就是HotSpare盤。分析其他盤以及Oracle數(shù)據(jù)庫頁在每個(gè)磁盤中的分布情況,獲取到該RAID5的條帶大小、磁盤順序及數(shù)據(jù)走向等RAID相關(guān)信息。利用獲取到的raid相關(guān)信息虛擬重構(gòu)RAID5,然后分析LUN在RAID5中的分配情況以及LUN分配的數(shù)據(jù)塊MAP。只需要將LUN的數(shù)據(jù)塊分布MAP提取出來,針對這些信息編寫相應(yīng)的程序,解析LUN的數(shù)據(jù)MAP,然后根據(jù)數(shù)據(jù)MAP導(dǎo)出LUN的數(shù)據(jù)即可恢復(fù)數(shù)據(jù)。
服務(wù)器數(shù)據(jù)恢復(fù)過程:
一、恢復(fù)Oracle數(shù)據(jù)庫數(shù)據(jù)。
1、將包含Oracle數(shù)據(jù)庫數(shù)據(jù)的LUN進(jìn)行JFS2文件系統(tǒng)解析,人工修復(fù)文件系統(tǒng)的不完整部分。
2、利用北亞企安自主開發(fā)的JFS2文件系統(tǒng)解析工具解析修復(fù)完成的LUN,然后恢復(fù)文件系統(tǒng)中所有的Oracle數(shù)據(jù)庫文件。
3、檢測Oracle數(shù)據(jù)庫文件的完整性。針對檢測有壞塊的數(shù)據(jù)庫文件,通過掃描所有硬盤找到所有Oracle碎片,組合掃描到的數(shù)據(jù)頁,人工將有壞塊的數(shù)據(jù)庫文件修復(fù)完整。
4、恢復(fù)完所有Oracle數(shù)據(jù)庫之后,發(fā)現(xiàn)SAP應(yīng)用還是無法正常使用。經(jīng)過分析發(fā)現(xiàn)SAP應(yīng)用的一些重要數(shù)據(jù)也是存放在損壞的存儲中,如果沒有這些重要的數(shù)據(jù),即使在Oracle數(shù)據(jù)庫完整的情況下SAP應(yīng)用也無法正常使用。
二、恢復(fù)SAP應(yīng)用數(shù)據(jù)。
1、對恢復(fù)出來的所有LUN都進(jìn)行文件系統(tǒng)解析,將包含SAP應(yīng)用數(shù)據(jù)的LUN進(jìn)行文件系統(tǒng)的一致性檢測。人工修復(fù)文件系統(tǒng)不完整部分,直至恢復(fù)出所有SAP及SAP Test的數(shù)據(jù)。
2、檢測恢復(fù)出來的SAP應(yīng)用數(shù)據(jù),對損壞的SAP應(yīng)用數(shù)據(jù)進(jìn)行修復(fù),直至所有SAP數(shù)據(jù)都完整,只有這樣才能保證SAP應(yīng)用能夠正常使用。
3、SAP數(shù)據(jù)修復(fù)完成后,結(jié)合之前恢復(fù)出來的Oracle數(shù)據(jù)庫,即可啟動(dòng)SAP應(yīng)用了。
三、啟動(dòng)并修復(fù)Oracle數(shù)據(jù)庫及SAP應(yīng)用
1、啟動(dòng)數(shù)據(jù)庫并修復(fù)。
把恢復(fù)的Oracle數(shù)據(jù)庫文件還原到已搭建好的環(huán)境中,并嘗試啟動(dòng)Oracle數(shù)據(jù)庫。在啟動(dòng)過程中由于數(shù)據(jù)庫一些臨時(shí)文件的校驗(yàn)不一致導(dǎo)致數(shù)據(jù)庫啟動(dòng)失敗。聯(lián)系Oracle數(shù)據(jù)庫工程師對數(shù)據(jù)庫進(jìn)行修復(fù),修復(fù)完成后Oracle數(shù)據(jù)庫啟動(dòng)成功,經(jīng)過反復(fù)驗(yàn)證確認(rèn)數(shù)據(jù)庫中的所有用戶及所有表均完整,然后嘗試啟動(dòng)SAP。
2、啟動(dòng)SAP并修復(fù)。
將恢復(fù)出來的SAP數(shù)據(jù)還原到已搭建好的環(huán)境中并啟動(dòng)SAP,SAP啟動(dòng)正常,但SAP中的用戶權(quán)限及使用異常,SAP表現(xiàn)為沒有序列號。北亞企安數(shù)據(jù)恢復(fù)工程師初步判斷是因?yàn)镾AP的注冊文件沒有恢復(fù)出來。重新檢測恢復(fù)過程,排查可能疏忽的地方,結(jié)果發(fā)現(xiàn)確實(shí)因?yàn)槲募到y(tǒng)損壞導(dǎo)致某些文件沒有恢復(fù)出來。重新修復(fù)文件系統(tǒng)并恢復(fù)這些數(shù)據(jù),然后啟動(dòng)并檢查SAP,結(jié)果一切正常。
3、在用戶方工程師配合下啟動(dòng)服務(wù)器內(nèi)的Oracle數(shù)據(jù)庫和SAP,通過SAP客戶端反復(fù)驗(yàn)證SAP中所有的數(shù)據(jù),沒有發(fā)現(xiàn)任何問題,恢復(fù)出來的數(shù)據(jù)完整可用。本次數(shù)據(jù)恢復(fù)任務(wù)完成。
審核編輯:湯梓紅
-
服務(wù)器
+關(guān)注
關(guān)注
12文章
9256瀏覽量
85762 -
數(shù)據(jù)恢復(fù)
+關(guān)注
關(guān)注
10文章
584瀏覽量
17552 -
磁盤
+關(guān)注
關(guān)注
1文章
379瀏覽量
25235 -
RAID5
+關(guān)注
關(guān)注
0文章
122瀏覽量
12747
發(fā)布評論請先 登錄
相關(guān)推薦
評論