這個是兩年前學習Oracle總結的東西,不算什麼新東西,僅作為個人的一個記錄,也歡迎大家一起學習討論。
Oracle數據庫的介質恢復過程相對非常復雜,Oracle畢竟作為一個大系統,設計是相當復雜和龐大的。鄙人結合對controlfile,redo log,datafile等文件的dump內容進行分析,試圖深入的了解oracle的介質恢復過程。雖不能從正向了解內部工作機制,但是從逆向推斷也能做個大致了解,以此增強對Oracle的使用信心吧。
從這裡開始吧:
1,獲取media-recovery-start SCN.
檢查所有數據文件頭,選擇最小的checkpoint SCN值作為start SCN。
假如獲取到的checkpoint SCN值在數據文件的offline的SCN范圍內,則采用offline-end的SCN。
2,checkpoint structure檢查thread啟動數量
media-recovery SCN中的checkpoint structure檢查在該SCN點有幾個thread線程啟動了。
3,分配log buffer
為第二步中的每個啟動的thread分配log buffer。
4,打開log文件
--如果log文件在線,系統將會自動打開;
--如果已經歸檔,將會提示管理員輸入log文件名稱。
5,分配獨占型media recovery lock
為每個需要執行media recovery的數據文件分配一個excusive(獨占)media recovery lock。
6,對每個數據文件設置fuzzy bit
7,checkpoint bitvec 決定了初始啟動的thread。
8,thread線程讀取相應的redo,並應用於數據庫。
9,Media recovery發生檢查點:
--應用redo文件過程中,需要轉換redo文件,每當轉換時都會發生Media Recovery checkpoints。
--當數據文件的STOP SCN達到時,也會發生Media Recovery checkpoints,數據文件頭的checkpoint也會被推進到該值。
10,完成media checkpoint
所有的thread完成其對應的redo日志應用,達到數據文件的有限STOP SCN值,完成了media recovery;
media recovery fuzzy bit被清除,或者叫做重置為(0x0000.00000000 day/month/year hh24:mi:ss);
接著更新數據文件頭和控制文件,表明了數據庫整體一致。
文檔參考:記著開始時從google找到一篇介紹Oracle internal的文章作為了參考,並結合著dump文件的內容才有此體會。要感謝一些那位“默默無聞”的作者。