Oracle數據庫作為復雜運算的首選數據庫,其首先是通過所謂的數據高速緩存來實現對數據的高速運算與操作的。
數據高速緩存跟操作系統的緩存類似,其存儲最近從數據文件中讀取的數據塊,其中的數據可以被所有的用戶所訪問。如當我們利用Select語句從數據庫中查詢員工信息的時候,其首先不是從數據文件中去查詢這個數據,而是從數據高速緩存中去查找,而沒有這個必要再去查詢磁盤中的數據文件了。只有在數據緩存中沒有這個數據的時候,數據庫才會從數據文件中去查詢。Oracle數據庫為什麼要如此設計呢?這是由於數據庫在讀取數據的時候,讀取內存的速度比讀取磁盤的速度要快很多倍,所以這種機制可以提高數據的整體訪問效率。
雖然其他數據庫也有這方面的設計,但是,相對來說,Oracle數據庫比其他數據庫,在這方面有更加出色的表現。難怪Oracle數據庫在內存的要求上,比其他數據庫要高。若以稍微的代價犧牲一些內存,而換取更高的數據訪問性能。筆者認為還是值得的。下面我們就來看看,Oracle數據庫在數據高速緩存上有哪些特殊的表現。
一、 空閒緩存塊
當我們重新啟動數據庫後,系統就會為數據庫分配一些空閒的緩存塊。空閒緩存塊中是沒有任何數據的,他在那邊默默的等著別寫入記錄。當Oracle 數據庫從數據文件中讀取數據後,數據庫就會尋找是否有空閒的緩存塊,以便將數據寫入其中。
一般來說,數據庫在啟動的時候,就會在內存中預先分配這些緩存塊。所以,Oracle數據庫在啟動的時候,會占用比較多的內存。但是,這可以免去在實際需要時向內存申請的時間。所以,有時候Oracle數據庫雖然已啟動,內存的占用率就很高,但是,其後續仍然可以正常運行的原因。而其他數據庫雖然剛啟動的時候內存占用率不是很高,但是,但系統內存到達80%以上時,在進行數據處理就會受到明顯的影響。
所以,當我們利用SELECT語句從數據庫文件中讀取文件的時候,數據庫首先會尋找是否有空閒的緩存。
二、命中緩存塊
當SELECT語句先從數據庫文件中讀取數據後,會把取得的數據放入到這個命中緩存塊中。也就是說,當我們利用查詢語句從數據庫查詢處員工信息後,這個信息就會被保存在高速緩存中。直道高速緩存消耗完畢等原因,這個空間才會被釋放。如此的話,下次用戶在查詢員工信息的時候,就不需要從數據庫文件中再次查詢相關信息,而直接從數據高速緩存中提取數據,從而提高數據庫的訪問效率。
另外要注意的一個問題是,命中緩存塊中的數據不會被寫入數據文件。確實,這個命中緩存塊中的數據沒有被更改,其當然也不會被寫入數據庫文件中。
三、髒緩存塊
當我們利用SELECT查詢語句把員工信息的數據查詢出來後,數據庫會把這個數據所存儲的空緩存塊做標記,表示該緩存塊已經存有數據,使命中緩存塊。此時,我們若在利用數據更新語句UPDATE對其中某條記錄進行更新時,如要把張三的名字改為張四。運行UPDATE語句後,數據庫也首先從高速緩存中查找是否有這條記錄,若存在這條記錄的話,就直接更改這條記錄,並且把該緩存塊標記為贓緩存塊。如此的話,就可以保持數據的一致性。
也就是說,髒緩存塊存儲的是已經被修改過的,但是還沒有寫入到數據庫文件的信息。當SQL的UPDATE等數據更新語句對某個緩存塊中的數據進行更改之後,這個命中緩存塊就會被數據庫標記為髒緩存塊。當滿足一定的條件時,這些髒緩存塊中的數據內容會被寫入到數據庫文件中去,以便永久性的保留數據庫修改記錄。
當系統中沒有空閒緩存塊,而用戶又需要查詢數據時,數據庫就查詢當前所有的髒緩存塊,把最先更改的髒緩存塊中的內容先寫入數據庫文件中,以便釋放這個髒緩存塊。數據庫就又會把這個髒緩存塊標記為空閒緩存塊,以方便用戶下次存入數據。
那Oracle數據庫到底是通過什麼手段,來控制空閒緩存塊、命中緩存塊、髒緩存塊之間的相互轉換的呢?說出來也許你不相信,Oracle數據庫就是通過兩張表,來管理這麼復雜的功能。這兩張表分別是DIRTY列表與LRU列表。
其中LRU列表保存著所有空閒緩存塊、命中緩存塊已經還沒有被移入到DIRTY列表中的髒緩存塊。當Oracle數據庫用戶在查詢數據的時候,可能會遇到如下情況:
1、當用戶查找員工信息時,數據庫首先在LRU列表中查詢是否有空閒緩存塊。其查詢的數據是從尾部開始查找。當查找有空閒的緩存塊時,數據庫就會把查到的數據寫入到這個空閒緩存中。
2、若數據庫在查詢的時候,首先查到的是髒緩存的話,則會把這個髒緩存移動到DIRTY列表中,然後再繼續查詢,直到查詢到合適的空閒緩存塊為止。
3、若數據庫在LRU列表中,從尾到頭查了一遍,沒有找到空閒緩存塊,或者雖然有空閒緩存塊,但是其容量不符合要求時,數據庫就會暫時結束這一次查找。然後,系統就會觸發數據庫寫進程,把DIRTY列表中的髒緩存塊寫入到數據庫中去。已經被寫入到數據庫文件中去的髒緩存塊將又被數據庫標記為空閒緩存塊,並插入到LRU列表中。當數據庫執行完畢這個動作之後,數據庫又會對LRU列表進行搜索,找到合適的數據高速空閒緩存之後,就會把讀取的數據寫入到這個空閒緩存中。所以,我們在利用數據庫的時候,會發現有時候讀取大量數據的時候,速度會比較慢。除了其他原因外,也有一部份原因是因為數據庫沒有查到足夠大的空閒緩存在存放這些數據,故只好寫進行讀寫操作,以釋放更多的髒緩存,然後再進行查詢操作。
知道了這些數據庫高速緩存工作原理之後,我們數據庫管理員又該做些什麼呢,來對Oracle數據庫進行優化。為此,筆者有以下建議:
1、為Oracle數據庫配置盡量大的內存。Oracle數據庫最新版本,根據官方的建議,其內存需要1G。雖然在低於這個內存數量的時候,數據庫仍然可以運行,但是,其運行適度會大打折扣。當查詢大量數據的時候,更是比較吃力。筆者現在使用的數據庫服務器,是使用了4個G的內存。以前我用的是2個G的。內存升級後,發現數據庫的性能得到了比較大的改善。
2、在對數據進行查詢操作時,盡量使用限制條件。如現在需要查詢銷售部門的員工信息時,我們不需要查詢全部的員工信息,而是在SELECT語句中,利用WHERE條件語句設置查詢條件。如此的話,就可以充分利用DIRTY列表中的空閒緩存塊,而不會因為空閒緩存塊容量不夠而頻繁的去執行數據庫寫操作。這會明顯降低數據庫的運行操作。同時,在查詢時,最好也能夠明確查詢的信息,如你只需要員工的姓名與入職日期,那就不需要把員工的出生年月、身份證號碼都查詢出來。所以,有時候合理設計視圖,也可以提高數據庫的運行效率。
3、最好不要在數據庫服務器上運行其他的服務。在數據庫服務器中,若還運行其它服務器的話,除了硬件資源爭奪影響服務器的運行效率之外,還會產生一個問題。就是會使得數據庫的數據高速緩存塊不連續。這會直接影響數據庫查詢空閒緩存塊的效率。對髒緩存塊進行數據庫寫入操作以及數據庫進行標記之間的轉換也會產生影響。所以,根據筆者的經驗,數據庫服務器最好能夠獨立。最多只能跟其對應的應用服務器部署在同一台服務器上。如現在Oracle數據庫是一台ERP系統的後台數據庫,最好數據庫能夠跟ERP服務器分開部署。但是,若由於服務器資金的限制,那麼可以把ERP應用服務器跟數據庫服務器部署在一台服務器上。但是,不能再跟郵件服務器等應用服務器放在一起。這會影響數據高速緩存的管理效率,從而最終影響數據庫的運行效能。現在服務器價格逐漸下滑,服務器的成本已經不是影響企業數據庫應用的關鍵。所以,出於數據庫性能考慮,筆者認為,企業在這上面還是應該大方的進行投資。沒必要為了這麼一點點錢,影響到數據庫的性能。