ORACLE分區表、分區索引ORACLE對於分區表方式其實就是將表分段存儲,一般普通表格是一個段存儲,而分區表會分成多個段,所以查找數據過程都是先定位根據查詢條件定位分區范圍,即數據在那個分區或那幾個內部,然後在分區內部去查找數據,一個分區一般保證四十多萬條數據就比較正常了,但是分區表並非亂建立,而其維護性也相對較為復雜一點,而索引的創建也是有點講究的,這些以下盡量闡述詳細即可。
1、類型說明:
range分區方式,也算是最常用的分區方式,其通過某字段或幾個字段的組合的值,從小到大,按照指定的范圍說明進行分區,我們在INSERT數據的時候就會存儲到指定的分區中。
List分區方式,一般是在range基礎上做的二級分區較多,是一種列舉方式進行分區,一般講某些地區、狀態或指定規則的編碼等進行劃分。
Hash分區方式,它沒有固定的規則,由ORACLE管理,只需要將值INSERT進去,ORACLE會自動去根據一套HASH算法去劃分分區,只需要告訴ORACLE要分幾個區即可。
分區可以進行兩兩組合,ORACLE 11G以前兩兩組合都必須以range作為一級分區的開頭,ORACLE目前最多支持2級別分區,但這個級別已經夠我們使用了。
我這只以最簡單的分區方式創建分區來說明問題,就拿range分區來說明問題吧(基本創建語句如下):
CREATE [url=]TABLE[/url] TABLE_PARTITION(
COL1 NUMBER,
COL2 VARCHAR2(10)
)
partition by range(COL1)(
partition TAB_PARTOTION_01 values less than (450000),
partition TAB_PARTOTION_02 values less than (900000),
partition TAB_PARTOTION_03 values less than (1350000),
partition TAB_PARTOTION_04 values less than (1800000),
partition TAB_PARTOTION_OTHER values less THAN (MAXVALUE)
);
這個分區表創建了四個定長分區,理想情況下,存儲450000條數據,擴展分區是超過這個數額的分區,當發現擴展分區有數據的時候,可以進行將擴展分區做SPLIT操作,這個後面說明,這裡先說一下一些常用的分區表查詢功能,我們先插入一些數據進去。
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(1,'數據測試');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(23,'數據測試');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(449000,'數據測試');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(450000,'數據測試');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(1350000,'數據測試');
INSERT INTO TABLE_PARTITION(COL1,COL2))
VALUES(900000,'數據測試');
INSERT INTO TABLE_PARTITION(COL1,COL2)
VALUES(1800000-1,'數據測試');
COMMIT;
為了檢測哪些分區中有哪些數據分別按照分區去查詢數據(應用開發中基本不會用到,因為不會把分區寫死)
SQL> SELECT * FROM TABLE_PARTITION partition(TAB_PARTOTION_01);
COL1 COL2
---------- ---------------
1 數據測試
23 數據測試
449000 數據測試
說明第一個分區有:1、23、44900這些數據,也就是插入時,ORACLE是自己去找分區的,其實分區這種子表[url=]管理[/url]自己也可以通過程序去完成,ORACLE給你提供了一套,就可以自己去完成了。其余的數據就自己查了,都是一個道理。
2、分區應用:
一般一張表超過2G的大小,ORACLE是推薦使用分區表的,分區一般都需要創建索引,說到分區索引,就可以分為:全局索引、分區索引,即:global索引和local索引,前者為默認情況下在分區表上創建索引時的索引方式,並不對索引進行分區(索引也是表結構,索引大了也需要分區,關於索引以後專門寫點)而全局索引可修飾為分區索引,但是和local索引有所區別,前者的分區方式完全按照自定義方式去創建,和表結構完全無關,所以對於分區表的全局索引有以下兩幅網上常用的圖解:
2.1、對於分區表的不分區索引(這個有點繞,不過就是表分區,但其索引不分區):
創建語法(直接創建即可):
CREATE INDEX <index_name> ON <partition_table_name>(<column_name>);
2.2、對於分區表的分區索引:
創建語法為:
CREATE [url=]INDEX[/url] INX_TAB_PARTITION_COL1 ON TABLE_PARTITION(COL1)
GLOBAL PARTITION BY RANGE(COL1)
PARTITION IDX_P1 values less than (1000000),
PARTITION IDX_P2 values less than (2000000),
PARTITION IDX_P3 values less than (MAXVALUE)
)
2.3、LOCAL索引結構:
創建語法為:
CREATE INDEX INX_TAB_PARTITION_COL1 ON TABLE_PARTITION(COL1) LOCAL;
也可按照分區表的的分區結構給與一一定義,索引的分區將得到重命名。
分區上的位圖索引只能為LOCAL索引,不能為GLOBAL全局索引。
2.4、對比索引方式:
一般使用LOCAL索引較為方便,而且維護代價較低,並且LOCAL索引是在分區的基礎上去創建索引,類似於在一個子表內部去創建索引,這樣開銷主要是區分分區上,很規范的管理起來,在OLAP系統中應用很廣泛;而相對的GLOBAL索引是全局類型的索引,根據實際情況可以調整分區的類別,而並非按照分區結構一一定義,相對維護代價較高一些,在OLTP環境用得相對較多,這裡所謂OLTP和OLAP也是相對的,不是特殊的項目,沒有絕對的劃分概念,在應用過程中依據實際情況而定,來提高整體的運行性能。
3、常用視圖:
1、查詢當前用戶下有哪些是分區表:
SELECT * FROM USER_PART_TABLES;
2、查詢當前用戶下有哪些分區索引:
SELECT * FROM USER_PART_INDEXES;
3、查詢當前用戶下分區索引的分區信息:
SELECT * FROM USER_IND_PARTITIONS T
WHERE T.INDEX_NAME=?
4、查詢當前用戶下分區表的分區信息:
SELECT * FROM USER_TAB_PARTITIONS T
WHERE T.TABLE_NAME=?;
5、查詢某分區下的數據量:
SELECT COUNT(*) FROM TABLE_PARTITION PARTITION(TAB_PARTOTION_01);
6、查詢索引、表上在那些列上創建了分區:
SELECT * FROM USER_PART_KEY_COLUMNS;
7、查詢某用戶下二級分區的信息(只有創建了二級分區才有數據):
SELECT * FROM USER_TAB_SUBPARTITIONS;
4、維護操作:
4.1、刪除分區
ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_03;
如果是全局索引,因為全局索引的分區結構和表可以不一致,若不一致的情況下,會導致整個全局索引失效,在刪除分區的時候,語句修改為:
ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_03 UPDATE GLOBAL INDEXES;
4.2、分區合並(從中間刪除掉一個分區,或者兩個分區需要合並後減少分區數量)
合並分區和刪除中間的RANGE有點像,但是合並分區是不會刪除數據的,對於LIST、HASH分區也是和RANGE分區不一樣的,其語法為:
ALTER TABLE TABLE_PARTITION MERGE PARTITIONS TAB_PARTOTION_01,TAB_PARTOTION_02 INTO PARTITION MERGED_PARTITION;
4.3、分隔分區(一般分區從擴展分區從分隔)
ALTER TABLE TABLE_PARTITION SPLIT PARTITION TAB_PARTOTION_OTHERE AT(2500000)
INTO (PARTITION TAB_PARTOTION_05,PARTITION TAB_PARTOTION_OTHERE);
4.4、創建新的分區(分區數據若不能提供范圍,則插入時會報錯,需要增加分區來擴大范圍)
一般有擴展分區的是都是用分隔的方式,若上述創建表時沒有創建TAB_PARTOTION_OTHER分區時,在插入數據較大時(按照上述建立規則,超過1800000就應該創建新的分區來存儲),就可以創建新的分區,如:
為了試驗,我們將擴展分區先刪除掉再創建新的分區(因為ORACLE要求,分區的數據不允許重疊,即按照分區字段同樣的數據不能同時存儲在不同的分區中):
ALTER TABLE TABLE_PARTITION DROP PARTITION TAB_PARTOTION_OTHER;
ALTER TABLE TABLE_PARTITION ADD PARTITION TAB_PARTOTION_06 VALUES LESS THAN(2500000);
在分區下創建新的子分區大致如下(RANGE分區,若為LIST或HASH分區,將創建方式修改為對應的方式即可):
ALTER TABLE <table_name> MODIFY PARTITION <partition_name> ADD SUBPARTITION <user_define_subpartition_name> VALUES LESS THAN(....);
4.5、修改分區名稱(修改相關的屬性信息):
ALTER TABLE TABLE_PARTITION RENAME PARTITION MERGED_PARTITION TO MERGED_PARTITION02;
4.6、交換分區(快速交換數據,其實是交換段名稱指針)
首先創建一個交換表,和原表結構相同,如果有數據,必須符合所交換對應分區的條件:
CREATE TABLE TABLE_PARTITION_2
AS SELECT * FROM TABLE_PARTITION WHERE 1=2;
然後將第一個分區的數據交換出去
ALTER TABLE TABLE_PARTITION EXCHANGE PARTITION TAB_PARTOTION_01
WITH TABLE TABLE_PARTITION_2 INCLUDING INDEXES;
此時會發現第一個分區的數據和表TABLE_PARTITION_2做了瞬間交換,比TRUNCATE還要快,因為這個過程沒有進行數據轉存,只是段名稱的修改過程,和實際的數據量沒有關系。
如果是子分區也可以與外部的表進行交換,只需要將關鍵字修改為:SUBPARTITION 即可。
4.7、清空分區數據
ALTER TABLE <table_name> TRUNCATE PARTITION <partition_name>;
ALTER TABLE <table_name> TRUNCATE subpartition <subpartition_name>;
9、磁盤碎片壓縮
對分區表的某分區進行磁盤壓縮,當對分區內部數據進行了大量的UPDATE、DELETE操作後,一定時間需要進行磁盤壓縮,否則在查詢時,若通過FULL SCAN掃描數據,將會把空塊也會掃描到,對表進行磁盤壓縮需要進行行遷移操作,所以首先需要操作:
ALTER TABLE <table_name> ENABLE ROW MOVEMENT ;
對分區表的某分區壓縮語法為:
ALTER TABLE <table_name>
modify partition <partition_name> shrink space;
對普通表壓縮:
ALTER TABLE <table_name> shrink space;
對於索引也需要進行壓縮,索引也是表:
ALTER INDEX <index_name> shrink space;
10、分區表重新分析以及索引重新分析
對表進行壓縮後,需要對表和索引進行重新分析,對表進行重新分析,一般有兩種方式:
在ORACLE 10G以前,使用:
BEGIN
dbms_stats.gather_table_stats(USER,UPPER('<table_name>'));
END;
ORACLE 10G後,可以使用:
ANALYZE TABLE <table_name> COMPUTE STATISTICS;
索引重新分析,將上述兩種方式分別修改一下,如第一種可以使用:gather_index_stats,而第二種修改為:ANALYZE INDEX即可,不過一般比較常用的是重新編譯:
對於分區表並進行了索引分區的情況,需要對每個分區的索引進行重新編譯,這裡以LOCAL索引為例子(其每個索引的分區和表分區結構相同,默認分區名稱和表分區名稱相同):
ALTER INDEX <index_name> REBUILD PARTITION <partition_name>;
對於全局索引,根據全局索引鎖定義的分區名稱修改即可,若沒有分區,和普通單表索引重新編譯方式相同:
ALTER INDEX <index_name> REBUILD;
11、關聯對象重新編譯,
上述對表、索引進行重新編譯,尤其對表進行了壓縮後會產生行遷移,這個過程可能會導致一些視圖、過程對象的失效,此時要將其重新編譯一次。
12、擴展:HASH分區中,如果創建了新的分區,可以將其進行重新HASH分布:
ALTER TABLE <table_name> COALESCA PARTITION%
5、回歸總結:何時建分區,分區類別,索引,如何對應[url=]SQL[/url]
1、創建時機
上述已經說明,2G以上的表,ORACLE推薦創建分區。
分區的方式根據實際情況而定,才能提高整體性能。
分區的字段一定要是經常用以提取數據的字段,否則會在提取過程中導致遍歷多個分區,這樣比沒有分區還要慢。
分區字段要選擇合適,數據較為均勻分布到各個分區,不要太多也不要太少,而且根據分區字段可以很快定位到分區范圍。
一般情況下,盡量然業務操作在同一個分區內部完成。
2、分區類別
分區主要有RANGE、LIST、HASH;
RANGE通過值的范圍分區,也是最常用的分區,這種分區注意在一種變長數字字符串中,很多人會導致認為是數字類型,而按照數字區分區,這樣會分布十分不均勻的現象發生。
LIST是列舉方式進行分區,一般作為二級分區而存在(當然也可以自己分區,ORACLE 11G後在分區上也可以作為主分區而存在),在RANGE基礎上,若數據需要繼續分區,並且在RANGE基礎上數據量較為固定,只是較大,可以按照一定規則進一步分區。 }
HASH只指定分區個數,分區細節由ORACLE完成,增加HASH分區可以重新分布數據。
注意:分區字段不能使用函數轉換後在分區,如,將某數字字符串字段,先TO_NUMER(COL_NAME)後分區。
3、索引類別
大致分:GLOBAL索引和LOCAL索引,錢和可以分:GLOBAL不分區索引,和GLOBAL分區索引。
GLOBAL不分區索引一般不太推薦,因為是用一顆大的索引樹來映射一個表,這個過程,這樣速度不見得比不分區快。
GLOBAL分區索引,查找數據若通過要通過索引,是先定位了索引內部的分區,然後在這個分區索引中找到ROWID,然後回表提取數據。
LOCAL索引是和分區的個數逐個對應的,可以說先定位分區表的分區也可以說先定位索引的分區,因為他們是一一對應的,找到對應分區後,分區內部索引數據集合。
4、對應應用0
分區表、索引、分區索引,要利用其性能優勢,最基本就是要提取數據時,要通過它首先將數據的范圍縮小到一個即使做全盤掃描也不會太慢的情況。
所以SQL一定要有分區上的這個字段的一個WHERE條件,將數據迅速定位到分區內部,而且盡量定位到一個分區裡面(這個和創建分區的規則有關系)。
建立分區本身不提要性能,要用好才可提高性能,在必要的RAC集群中,若存在多分區提取數據,適當采用並行提取可以提高提取的速度。
對於索引部分,這裡也只提到分區索引的創建方式以及常見索引的維護方式,對於索引原理理解後會更容易認識到提取數據時的技巧。