以下的文章主要是從相關用戶的請求開始入手的,Oracle數據庫完整的相關工作機制是如何運行得出?首先如果某個用戶相關進程發出一個相關的連接請求的話,如果你所使用的是主機命名或者是本地服務命中的主機名使用的是機器名(非IP地址)。
那麼這個請求都會通過DNS服務器或HOST文件的服務名解析然後傳送到Oracle監聽進程,監聽進程接收到用戶請求後會采取兩種方式來處理這個用戶請求,下面我們分專用服務器和共享服務器分別采用這兩種方式時的情況來講:
專用服務器模式下:
一種方式是監聽進程接收到用戶進程請求後,產生一個新的專用服務器進程,並且將對用戶進程的所有控制信息傳給此服務器進程,也就是說新建的服務器進程繼承了監聽進程的信息,然後服務器進程給用戶進程發一個RESEND包,通知用戶進程可以開始給它發信息了,用戶進程給這個新建的服務器進程發一個CONNECT包,服務器進程再以ACCEPT包回應用戶進程,致此,用戶進程正式與服務器進程確定連接。
我們把這種連接叫做HAND-OFF連接,也叫轉換連接。另一種方式是監聽進程接收到用戶進程的請求後產生一個新的專用服務器進程,這個服務器進程選用一個TCP/IP端口來控制與用戶進程的交互,然後將此信息回傳給監聽進程,監聽進程再將此信息傳給用戶進程。
用戶進程使用這個端口給服務器進程發送一個CONNECT包,服務器進程再給用戶進程發送一個ACCEPT包,致此,用戶進程可以正式向服務器進程發送信息了。
這種方式我們叫做重定向連接。HAND-OFF連接需要系統平台具有進程繼承的能力,為了使Windows NT/2000支持HAND-OFF必須在HKEY_LOCAL_MacHINE>SOFTWARE>Oracle>HOMEX中設置USE_SHARED_SOCKET。
共享服務器模式下:
只有重定向連接的方式,工作方式是監聽進程接收到用戶進程的請求後產生一個新的調度進程,這個調度進程選用一個TCP/IP端口來控制與用戶進程的交互,然後將此信息回傳給監聽進程,監聽進程再將此信息傳給用戶進程,用戶進程使用這個端口給調度進程發送一個CONNECT包,調度進程再給用戶進程發送一個ACCEPT包,致此,用戶進程可以正式向調度進程發送信息了。
可以通過設置MAX_DISPIATCHERS這個參數來確定調度進程的最大數目,如果調度進程的個數已經達到了最大,或者已有的調度進程不是滿負荷,監聽進程將不再創建新的調度進程,而是讓其中一個調度進程選用一個TCP/IP端口來與此用戶進程交互。
調度進程每接收一個用戶進程請求都會在監聽進程處作一個登記,以便監聽進程能夠均衡每個調度進程的負荷,所有的用戶進程請求將分別在有限的調度進程中排隊,所有調度進程再順序的把各自隊列中的部分用戶進程請求放入同一個請求隊列。
等候多個Oracle數據庫的共享服務器進程進行處理(可以通過SHARED_SERVERS參數設置共享服務器進程的個數),也就是說所有的調度進程共享同一個請求隊列,共享服務器模式下一個實例只有一個請求隊列,共享服務器進程處理完用戶進程的請求後將根據用戶進程請求取自不同的調度進程將返回結果放入不同的響應隊列,也就是說有多少調度進程就有多少響應隊列,然後各個調度進程從各自的響應隊列中將結果取出再返回給用戶進程。
以上我們講完了用戶與Oracle的連接方式,下面我們要講Oracle服務器進程如可處理用戶進程的請求,當一個用戶進程發出了一條SQL語名:UPDATE TABBLEA SET SALARY=SALARY*2;首先,服務器進程把這條語句的字符轉換成ASCII等效數字碼,接著這個ASCII碼被傳遞給一個HASH函數,並返回一個HASH值,服務器進程將到SHARED POOL 的共享PL/SQL區去查找是否存在同樣的HASH值。
如果存在,服務器進程將使用這條語句已高速緩存在SHARED POOL中的已分析過的版本來執行,如果不存在,服務器進程將對該語句進行語法分析,首先檢查該語句的語法的正確性,接著對語句中涉及的表、索引、視圖等對象進行解析,並對照數據字典檢查這些對象的名稱以及相關結構,並根據Oracle選用的優化模式以及數據字典中是否存在相應對象的統計數據和是否使用了存儲大綱來生成一個執行計劃或從存儲大綱中選用一個執行計劃,然後再用數據字典核對此用戶對相應對象的執行權限,最後生成一個編譯代碼。
Oracle數據庫將這條語名的本身實際文本、HASH值、編譯代碼、與此語名相關聯的任何統計數據和該語句的執行計劃緩存在SHARED POOL的共享PL/SQL區。服務器進程通過SHARED POOL 鎖存器來申請可以向哪些共享PL/SQL區中緩存這此內容,也就是說被SHARED POOL鎖存器鎖定的PL/SQL區中的塊不可被覆蓋,因為這些塊可能被其它進程所使用。
在SQL分析階段將用到LIBRARY CACHE,從數據字典中核對表、視圖等結構的時候,需要將數據字典從磁盤讀入LIBRARY CACHE,因此,在讀入之前也要使用LIBRARY CACHE鎖存器來申請用於緩存數據字典。 生成編譯代碼之後,接著下一步服務器進程要准備開始更新數據,服務器進程將到DB BUFFER中查找是否有相關對象的緩存數據,
下面分兩個可能進行解釋:
如果沒有,服務器進程將在表頭部請求一些行鎖,如果成功加鎖,服務器進程將從數據文件中讀這些行所在的數據塊放入DB BUFFER中空閒的區域或者覆蓋已被擠出LRU列表的非髒數據塊緩沖區,並且排列在LRU列表的頭部,如果這些非髒數據緩沖區寫完也不能滿足新數據的請求時,會立即觸發DBWN進程將髒數據列表中指向的緩沖塊寫入數據文件,並且清洗掉這些緩沖區,來騰出空間緩沖新讀入的數據,也就是在放入DB BUFFER之前也是要先申請DB BUFFER中的鎖存器。
成功鎖定後,再寫入DB BUFFER,然後服務器程將該語句影響的被讀入DB BUFFER塊中的這些行的ROWID及將要更新的原值和新值及SCN等信息逐條的寫入REDO LOG BUFFER,在寫入REDO LOG BUFFER之前也是先請求REDO LOG BUFFER塊的鎖存器,成功鎖定之後才開始寫入,當寫入達到REDO LOG BUFFER大小的三分之一或寫入量達到1M或超過三秒後或發生檢查點時或者DBWN之前發生,LGWR將把REDO LOG BUFFER中的數據寫入磁盤上的重做日志文件。
已被寫入重做日志文件的REDO LOG BUFFER中的塊上的鎖存器被釋放,並可被後來寫入的信息所覆蓋,REDO LOG BUFFER以循環的方式工作。當一個重做日志文件寫滿後,LGWR將切換到下一個重做日志文件,如果是歸檔模式,歸檔進程還將前一個寫滿的重做日志進程寫入歸檔日志文件,重做日志文件也是循環工作方式。寫完所有的REDO LOG BUFFER之後,服務器進程開始改寫這個DB BUFFER塊頭部的事務列表並寫入SCN,然後COPY包含這個塊的頭部事務列表及SCN信息的數據副本放入回滾段中,我們將回滾段中的副本稱為數據塊的“前映像”。
(回滾段可以存儲在專門的回滾表空間中,這個表空間由一個或多個物理文件組成,並專用於回滾表空間,回滾段也可在其它表空間中的數據文件中開辟。)然後改寫這個DB BUFFER塊的數據,並在其頭部寫入對應的回滾段地址,如果對一行數據多次UPDATE而不COMMIT則在回滾段中將會有多個“前映像”,除第一個“前映像”含有SCN信息外,其它的每個“前映像”的頭部還含有SCN信息和“前前映像”的回滾段地址。
一次UPDATE操作只對應一個SCN。然後服務器進程在髒數據列表中建立一條指向此緩沖塊的指針。接著服務器進程會從數據文件讀入第二個塊重復以上讀入,記日志,建立回滾段,修改,放入髒列表的動作,當髒數據列表達到一定長度時,DBWN進程將髒數據列表中指向的緩沖塊全部寫入數據文件,也就是釋放加在這些DB BUFER 塊上的鎖存器。其實Oracle數據庫可以一次從數據文件中讀入幾個塊放入DB BUFFER,可以通過參數DB_FILE_MULTIBLOCK_READ_COUNT來設置一次讀入的塊的個數。
如果要查找的數據已緩存,則根據用戶的SQL操作類型決定如何操作,如果是SELECT 則查看DB BUFFER塊的頭部是否有事務,如果有,將從回滾段讀取,如果沒有則比較SELECT 的SCN與DB BUFFER塊頭部的SCN如果比自己大,仍然從回滾段讀取,如果比自己小則認這是一個非髒緩存,可以直接從這個DB BUFFER塊中讀取。如果是UPDATE則即使在DB BUFFER中找到一個沒有事務,而且SCN比自己小的非髒緩存數據塊,服務器進程仍然要到表的頭部對這條記錄申請加鎖,加鎖成功則進行後續動作,如果不成功,則要等待前面的進程解鎖後才能進行動作。
只有當SQL語句影響的所有行所在的最後一個塊被讀入DB BUFFER並且重做信息被寫入REDO LOG BUFFER(僅是指重做日志緩沖,而非重做日志文件)之後,用戶才可以發出COMMIT,COMMIT觸發LGRW,但並不強制立即DBWN來釋放所有相應的DB BUFFER塊上的鎖,也就是說有可能出現已COMMIT,但在隨後的一段時間內DBWN還在寫這條語句涉及的數據塊的情形,表頭部的行鎖,並不是在COMMIT一發出就馬上釋放,實際上要等到相應的DBWN進程結束才會釋放。
一個用戶請求鎖定另一個用戶已COMMIT的資源不成功的機會是存在的,從COMMIT到DBWN進程結束之間的時間很短,如果恰巧在這個時間斷電,由於COMMIT已觸發LGWR進程,所以這些未來得及寫入數據文件的改變會在實例重啟後由SMON進程根據重做日志文件來前滾。如果未COMMIT就斷電,由於DBWN之前觸發LGWR,所有DBWN在數據文件上的修改都會被先一步記入重做日志文件,實例重啟後,SMON進程再根據重做日志文件來回滾。
如果用戶ROOLBACK,則服務器進程會根據數據文件塊和DB BUFFER中塊的頭部的事務列表和SCN以及回滾段地址找到回滾段中相應的修改前的副本,並且用這些原值來還原當前數據文件中已修改但未提交的改變。如果有多個“前映像”,服務器進程會在一個“前映像”的頭部找到“前前映像”的回滾段地址,一直找到同一事務下的最早的一個“前映像”為止。一旦發出了COMMIT,用戶就不能ROOLBACK,這使得COMMIT後DBWN進程還沒有全部完成的後續動作得到了保障。
下面我們要提到檢查點的作用,當一個全部檢查點發生的時候,首先讓LGWR進程將REDO LOG BUFFER中的所有緩沖(包含未提交的重做信息)寫入重做日志文件,然後讓DBWN進程將DB BUFFER中所有已提交的緩沖寫入數據文件(不強制寫未提交的)。
然後更新控制文件和數據文件頭部的SCN,表明當前數據庫是一致的,如果在發生檢點之前斷電,並且當時有一個未提交的改變正在進行,實例重啟之後,SMON進程將從上一個檢查點開始核對這個檢查點之後記錄在重做日志文件中已提交的和未提交改變,因為DBWN之前會觸發LGWR,所以DBWN對數據文件的修改一定會被先記錄在重做日志文件中。
因此,斷電前被DBWN寫進數據文件的改變將通過重做日志文件中的記錄進行還原,叫做回滾,如果斷電時有一個已提交,但DBWN動作還沒有完全完成的改變存在,因為已經提交,提交會觸發LGWR進程,所以不管DBWN動作是否已完成,該語句將要影響的行及其產生的結果一定已經記錄在重做日志文件中了,則實例重啟後,SMON進程根據重做日志文件進行前滾。
由此可見,實例失敗後用於恢復的時間由兩個檢查點之間的間隔大小來決定,我們可以通個四個參數設置檢查點執行的頻率,LOG_CHECKPOINT_INTERVAL決定了兩個檢查點之間寫入重做日志文件的系統物理塊的大小,LOG_CHECKPOINT_TIMEOUT決定了兩個檢查點之間的時間長度,FAST_START_IO_TARGET決定了用於恢復時需要處理的塊的大小,FAST_START_MTTR_TARGET直接決定了用於恢復的時間的長短。
SMON進程執行的前滾和回滾與用戶的回滾是不同的,SMON是根據重做日志文件進行前滾或回滾,而用戶的回滾一定是根據回滾段的內容進行回滾的。在這裡我們要說一下回滾段存儲的數據,假如是delete操作,則回滾段將會記錄整個行的數據,假如是update,則回滾段只記錄被修改了的字段的變化前的數據(前映像),也就是沒有被修改的字段是不會被記錄的,假如是insert,則回滾段只記錄插入記錄的rowid。
這樣假如事務提交,那回滾段中簡單標記該事務已經提交;假如是回退,則如果操作是是delete,回退的時候把回滾段中數據重新寫回數據塊,操作如果是update,則把變化前數據修改回去,操作如果是insert,則根據記錄的rowid 把該記錄刪除。
下面我們要講DBWN如何來寫數據文件,在寫數據文件前首先要找到可寫的空閒數據塊,Oracle中空閒數據塊可以通過FREELIST或BITMAP來維護,它們位於一個段的頭部用來標識當前段中哪些數據塊可以進行INSERT。
在本地管理表空間中Oracle數據庫自動管理分配給段的區的大小,區的分配信息存儲在組成表空間的數據文件的頭部,而數據字典管理的表空間用戶可以在創建時決定區的大小,並且區的分配信息是存儲在數據字典中的,只在本地管理的表空間中才能選用段自動管理,采用自動段空間管理的本地管理表空間中的段中的空閒數據塊的信息就存放在段的頭部並且使用位圖來管理,采用手動管理的本地管理表空間中的段和數據字典管理的表空間中的段中的空閒數據塊的管理都使用位於段頭部的空閒列表來管理,
空閒列表的工作方式:
首先一個空的數據塊被加入空閒列表,當其中空閒空間小於PCTFREE設置的值之後,這個塊從空閒列表刪除,當這個塊中的內容降至PCTUSED設置的值之下後,這個數據塊被再次加入空閒列表,位於空閒列表中的數據塊都是可以向其中INSERT的塊,當一個塊移出了空閒列表,但只要其中還有保留空間就可以進行UPDATE,當對其中一行UPDATE一個大數據時,如果當前塊不能完全放下整個行,只會把整個行遷移到一個新的數據塊,並在原塊位置留下一個指向新塊的指針,這叫行遷移。
如果一個數據塊可以INSERT,當插入一個當前塊裝不下的行時,這個行會溢出到兩個或兩個幾上的塊中,這叫行鏈接。如果用戶的動作是INSERT 則服務器進程會先鎖定FREELIST,然後找到空閒塊的地址,再釋放FREELIST,當多個服務器進程同時想要鎖定FREELIST時即發生FREELIST的爭用,可以在非采用自動段空間管理的表空間中創建表時指定FREELIST的個數。
默認為1,如果是在采用自動段空間管理的表空間中創建表,即使指定了FREELIST也會被忽略,因為此時將使用BITMAP而不是FREELIST來管理段中的空閒空間。如果用戶動作是UPDATE服務器進程將不會使用到FREELIST和BITMAP,因為不要去尋找一個空閒塊,而使用鎖的隊列。