在Oracle數據庫中,段往往被用來存儲特定邏輯對象的所有數據。如當建立數據庫表或者索引時,Oracle就會為這些對象分配存儲空間,以存放他們所需要的信息。段是由一個或者多個區組成的。不要看段是Oracle數據庫中一個不起眼的角色,其實,在其中,仍然隱藏著許多不為人知的管理技巧。若數據庫管理員能夠掌握這些內容,或許,其工作會變得輕松許多。
技巧一:對大表執行分區段
表分區段用於存儲分區表中某個分區的數據。如把某一個表分為幾個區,每個區就對應一個表分區段。這麼設置是可行的。因為根據段管理規則,在一個表空間上可以包含一個或者多個段,但是,一個段只能夠存放在一個表空間上。
在實際工作中,我們經常會碰到這種情況。如在一個大型零售企業的信息化管理系統中,一張銷售表的年數據總量可能會達到幾億條,其數據總容量可能會有近十個G。如果平均分配到每個季度的話,則就有2.5G。此時,如果不對這張銷售表進行分區分段管理的話,則這一年的銷售記錄都會存儲在一張表中。此時,如果需要做年度分析的話,那麼數據庫的性能將會受到很大的影響。如現在用戶想知道六、七月份空調的銷量變化情況,此時數據庫就需要掃描整個數據表中近10G的紀錄。這需要用戶等待比較長的時間。
但是,此時若數據庫管理員在數據庫設計的時候,就能夠預計到這種情況,對銷售表進行分區分段管理。即把這張銷售表分區段管理,也就是說,把銷售表分為四個分區段,每個季度一個區段。如此的話,若要統計六、七月份的空調銷售情況,則只需要查詢5G的數據即可,其數據查詢量將近減少了一半。顯然,在實際工作中,如果對大表進行分區段管理,則可以大大降低I/O次數,並有效提高數據庫查詢性能。若銷售量大的話,甚至可以把銷售表分為十二個區段,一個月對應一個區段。
所以,通過使用分區選項,采用表區段管理大表,可以將一張大表的數據部署到多個不同的分區段中。通過這種管理方式,可以降低I/O(輸入輸出)讀取次數,最終提高I/O性能。這是數據庫優化專家在提高數據庫性能時,經常用到的一種手段。特別是在零售行業的信息化管理系統中,經常被用到。
技巧二:合理利用索引組織表段
在Oracle數據庫中,跟索引相關的表段主要有三個,分別為索引段、索引分區段與索引組織表段。
索引段主要用來存儲索引數據。當數據庫管理員建立索引時,數據庫系統就會自動為索引建立相應的索引段,其名字跟索引的名稱相同。在對索引段進行管理時,有一個基本的原則,即一個索引段只能夠存放在一個表空間中。
索引分區段主要用來存儲分區索引某個分區的數據。他跟筆者上面所說的表分區段類似。每個分區對應一個索引分區段。通過使用分區選項可以將大索引的數據部署到幾個不同的分區段中,從而達到降低輸入輸出次數、提高數據庫性能的目的。不過其在管理中,比表分區段多了一個限制條件,即索引分區只能夠建立在分區表上,而不能夠建立在普通表上。其他的管理跟分區表段類似,就不再重復闡述了。
索引組織表是以B數結構來組織表數據的,其對應的段就是索引組織表段。其管理方式跟索引段類似。當數據庫管理員建立索引時,就會自動創建這個段,用來保存相關的數據。
現在擺在數據庫管理員面前,就有一個難題。在什麼時候用索引段,什麼時候用索引組織表段,又在什麼時候采用索引分區段呢?為此,筆者給出一個建議,供大家參考。
通常情況下,如果表中的數據經常需要引用主鍵列萊檢索的話,則可以考慮建立索引組織表,即通過索引組織段來管理。因為如果建立索引組織表段,則表和表主鍵索引的數據會存放在索引段中。從而提高查詢的速度。而在普通表中,表與索引數據分別存放在表段與索引段中。這就是兩者最本質的區別。另外需要提醒的是,如果數據庫管理員建立索引組織表時,數據庫開發人員必須要定義主鍵列。否則的話,就會以失敗告終。
而如果索引比較大的話,則可以將大索引的數據部署道幾個不同的分去段中,這可以有效提高數據庫的性能。
技巧三:減少臨時段的使用
臨時段主要用來存儲排序等操作所產生的臨時數據。如現在某張數據表中,有A、C、B、F、E、D等記錄。此時,若用Order By子句對其進行排序,數據庫系統就會返回A、B、C、D、E、F數據。這些被重新排序過的數據,就叫做臨時數據。通常情況下,這些臨時數據會存放在兩個地方,分別為PGA工作區與臨時段中。默認情況下,這些臨時數據會先存儲在PAG工作區。如果因為臨時數據比較大,PGA工作區已經滿了的情況下,數據庫會把剩下的臨時數據存放到臨時段中。
從理論上講,無論是把數據存放在PGA工作區還是存儲在臨時段中,對於用戶的最終結果沒有影響。但是,如果從數據庫性能方面考慮,則兩者就有比較大的差異。
PGA工作區,又叫做程序全局區域,它是包含服務器進程的數據和控制信息的非共享內存區域。通常情況下,只要數據庫服務器進程啟動,則Oracle就會在內存中創建程序全局區域。在10G以後的版本中,Oracle數據庫能夠自動根據內存的使用情況來管理程序全局區域,而不用數據庫管理員去手工的干預,從而使得PGA工作區的使用率更高。所以,一般來說,把臨時數據存放在PGA工作區,其效率更高。
在實際工作中,數據庫管理員應該盡量避免產生大量的臨時數據,或者說,盡量不讓臨時數據超過PGA工作區所能夠承受的最大容量。從而數據庫不得不把臨時數據存放到臨時段中。
在實際工作中,很多Select語句都會產生臨時數據。如在Select語句中,若加入Order By、Group By等子句,都會導致數據庫對數據文件中的記錄進行重新組織,從而產生大量的臨時數據。為此,在應用程序設計中,就最好能夠加入一些默認的查詢限制條件,從而避免產生大量的臨時數據。如在銷售表查詢的時候,如果用戶沒有輸入具體的查詢條件,則應用程序默認只查詢近30天的銷售記錄,並按交易的日期或者產品進行排序。如果這些記錄不能夠滿足用戶的需求,再進行全部記錄的查詢。如此設計的話,就可以在一定程度上減少臨時數據,減少臨時段使用的頻率。因為根據相關統計,用戶在查詢的時候,往往不會主動加入查詢條件。而他們所需要的數據,往往都是最近一些的交易記錄。為此,在應用程序設計過程中,加入一些默認的查詢條件是非常有必要的。
技巧四:LOB段最好獨立與普通表
在Oracle數據庫中,除了可以存放一些字符、數字等基本數據類型外,還可以存儲附件、圖像、音頻、視頻文件等等。用來存放這些數據的段,就叫做LOB段。當數據庫在創建這些特殊類型的列時,Oracle數據庫系統就會自動為他們建立對應的LOB段。通常情況下,如果這些特殊數據類型的長度比4000字節要少,則這一列與其他普通列的數據會一起存放在表段中,如果數據長度超過了4000字節,則數據庫就會被存放在LOB段中。
如果從數據庫性能方面考慮,最好能夠把這些特殊的數據類型跟其他數據類型分別存放。如現在有一張產品信息表,需要包含產品ID、產品名稱、產品規格、產品圖像等內容。那麼,在數據庫設計的時候,最好能夠建立兩張表,一張用來存儲產品ID、產品名稱、產品規格等信息;另一張表中存儲產品ID、產品圖像等信息。如此設計,主要是出於兩個方面的考慮。
一是在實際工作中,並不是每次查看產品信息時,都需要產品圖像的內容。如在生成訂單時,沒有必要再每次下單時都顯示產品圖片。因為對於一些老產品來說,這個產品圖像早就印在用戶腦海中。即使系統顯示圖片信息,用戶也不會去關注。
二是這會影響數據庫的查詢性能。眾所周知,數據庫查詢效率跟數據容量有很大的關系。數據容量越大,其查詢的效率越低。而LOB段中存儲的數據往往都是一些大容量的數據。所以在用戶不需要的情況下,顯示圖像等信息,就會大大降低數據庫的性能。再說,在一些應用程序中,由於網速或者刷新率等原因,其顯示圖像信息本身就要比顯示文字信息來的慢。這就更加延長了用戶的等待時間。
所以,LOB段的數據類型最好能夠跟表中的其他字段分開來管理。在數據庫設計的時候,就可以把他們存放在獨立的表中,然後通過關鍵字進行關聯。