Oracle提供了不少方法用於數據空間的使用、監控和維護,同時也在各版本中陸續對這方面的功能進行了增強,目的在於簡化這方面工作的復雜度,提高應用的運行效率。
一、相關概念
數據庫的空間在邏輯上分為多個表空間,每個表空間則由系統中的一個或多個物理數據文件構成;Oracle存儲數據的基本單位是塊,其大小在建庫時由DB_BLOCK_SIZE參數確定,一個或多個連續的塊構成一個區片(EXTENT),它作為數據對象存儲的基本單位來使用。在Oracle中,每個基本數據對象使用的空間稱為段(Segment),段存放在唯一的表空間上,每個段實際上是一系列區片(更為准確地是數據塊)的集合。每個簡單數據對象對應一個段;對於分區對象如分區表、索引,則每個(子)分區對應一個段,由各個(子)分區共同構成一個完整的數據對象。因此,可以把表空間看作桶,裡面放著許多段;一個段只能放在一個桶中,而不能跨越多個桶。
二、表空間的使用
表空間碎片的產生
由於同一個表空間中存放有多個數據段,各個數據段可以有不同的區片尺寸,不同段的區片可以交叉存放;當這些段中的區片經過分配(如創建表)、釋放(如刪除表)後,就可能使表空間中原本連續的空閒數據塊變成不連續,而區片必須由連續的數據塊構成,這時,當某一段需要分配新的區片時,就有可能出現雖然表空間空閒數據塊的總和大於所需區片的大小,但卻無法找到一串連續的塊來供此區片分配使用。這種情況就稱為表空間的ExtentFragmentation。我們經常會遇到這種情況,明明從DBA_FREE_SPACE中計算表空間還有幾百MB,但其中的某一個表卻無法再擴展幾個MB的空間。
消除表空間碎片
Oracle在段的區片分配上為用戶提供了很大的靈活性,然而如果未能正確使用創建表空間和數據對象的各個可選擇參數,則在最後將不可避免的要面對區片碎片的問題。Oracle的BhaskarHimatsingka和JuanLoaiza,為此提出了SAFE(SimpleAlgorithmforFragmentationElimination.)配制規則,通過遵循這套規則,區片級碎片可以完全的避免。而實際上,Oracle8i引入的新特性:LocalManagedTablespace就是SAFE規則在OracleServer的內置實現。SAFE原則概括起來包括:
1.對每個表空間上的段使用相同的區片尺寸;段參數INITIAL=NEXT,PCTINCREASE=0;可以通過使用CreateTablespace的‘MINIMUMEXTENT’子句來確保分配的區片是此參數的倍數;
2.僅在表空間級指定INITIAL、NEXT參數,在創建數據段時不要指定這些參數;
3.區片的大小根據段大小來確定,原則是均衡順序掃描的效率和空間的利用率,同時確保段的區片數目控制在1024之下;根據此原則,在進行相應測試之後,確定區片選取規則;
有此數據庫中可以只使用三種區片大小的表空間;在對象創建之前需對其大小進行評估,並放到相應的表空間中;
4.Oracle815引入了本地管理表空間,它在管理和性能上都優於傳統的字典管理表空間,它已融合了規則1、2、3;要使用此特性,在CREATETABLESPACE語句中指定EXTENTMANAGEMENTLOCAL子句;
5.段的區片數目上限應在4096之下,DML操作在此區片數目范圍內不會有明顯的性能差異;但某些DDL操作的速度則與區片的數目關系較大;因此合理的區片數目應保持在1024之下;對於持續不斷擴展的段,應監控區片數目,在必要時移至其它表空間;
6.對於特別大的數據段應控制在4G-128G(Oracle7為5G-160G)之間,它們應存放到單獨的表空間上,同時對於這些特大段應考慮使用分區拉提高性能;
7.用戶的臨時表空間應使用TEMPORARY類型;
8.當系統的事務規模比較均衡時可以對回滾段使用OPTIMAL參數,否則應避免制定OPTIMAL參數,而定期監控回滾段的大小,並在必要時重建;
9.臨時段和回滾段絕對不要將用戶數據存放到SYSTEM表空間,它是專為永遠不會Drop和Truncate的系統數據對象而設計的;
10.創建表空間時指定數據文件的大小應=區片整數倍+1數據塊,對於LocalManagedTablespace則為區片整數倍+64K;
11.當表空間使用統一的區片大小時,不要對其進行空間整理,重整的結果不僅耗費精力而且可能會使性能變差;對於未使用統一的區片尺寸的表空間應通過Export/Import重整;
12.8i提供了AlterTable…Move[Tablespace…]命令可用於快速重整表,AlterIndex…Rebuild…[Tablespace…]命令可用於快速重建索引。
有關使用單個區片的誤導
在許多關於碎片整理的文檔中建議在Export時使用Compress=Y選項,將表中的所有數據調整到一個區片中,期望在Import後獲得良好性能。由此讓許多人產生一個觀點,認為當表中數據全部存放到一個區片中時,可以獲得良好性能。實際上單區片段只在以下條件成立時,才具有優越性。
數據主要以(全段)掃描方式訪問;
段所對應的數據塊在物理磁盤上連續存放,Oracle可以發布較大的順序磁盤讀操作;
通過對這兩條進行分析可以發現,一方面數據庫中大部分表是通過索引來訪問,另一方面現在的數據庫文件一般在物理上使用了RAID5或RAID0+1技術,數據以條帶化方式分布到多個物理磁盤上,邏輯上的單個區片和多區片在物理上並無本質上的區別;另外,從Oracle的角度來看,管理幾百個區片的段是非常輕松的並不會有性能的下降。由此可見將整個段放到一個區片中並無明顯好處,而這種做法卻會導致表空間碎片的產生。
三、表數據段的使用
表空間的組織
Heap表的空間由一系列區片鏈接而成,每個數據塊除塊頭外其余部分可用於存放數據,在創建表時可以指定以下參數:
PCTFREE:塊中保留用於UPDATE操作的空間百分比,當數據占用的空間達到此上限時,新的數據將不能再插入到此塊中;
PCTUSED:指定塊中數據使用空間的最低百分比;當一個塊在達到PCTFREE,之後經歷了一些DELETE操作,在其空間使用下降到PCTUSED後便可以重新被用於INSERT數據;這就是PCTFREE/PCTUSED參數的含義;
調整PCTFREE、PCTUSED參數的目標一方面是提高性能,另一方面則主要是提高空間使用效率,避免出現塊中存在有許多未用的空間,但卻無法找到一個塊可以被用於插入新數據行的情況發生。
PCTFREE的使用
在Oracle中表的每一行數據由唯一的ROWID標記;而Oracle支持的數據類型中有一些長度是可變的,如VARCHAR,當對這些數據進行UPDATE時,如果塊中的可用空間不能容納UPDATE後的數據行時,Oracle將會把此行移到其它數據塊,同時保留此數據行的ROWID不變,並在原有塊中建一指針指向行遷移後的位置。在這種情況下讀取一行數據將需要訪問2個數據塊,從而導致性能下降。PCTFREE保留的空間就是為確保更改後的數據行可以仍存放於原有數據塊中,避免行遷移的情況發生。
由此,如果PCTFREE設置不足時可能產生行遷移;而另一方面如果PCTFREE設置過高,將會造成空間浪費。因此正確設置PCTFREE需要對表中數據的使用進行分析。對於數據長度不會變化或極少更新的情況,可以采用較小的PCTFREE;對於其它大多數情況應采用稍大的PCTFREE(PCTFREE的缺省值是10,如果不好估計需預留的空間,可以使用15-25的范圍),不要為節約塊中的空間而使用較小的PCTFREE值。