本文從以下幾個方面來整理關於分區表的概念及操作:
1.分區表的概念
2.表分區的具體作用
3.表分區的優缺點
4.表分區的幾種類型及操作方法
5.對表分區的維護性操作.
6.對分區索引的介紹
(1)分區、分區表簡介
ORACLE的分區:
是一種處理超大型表、索引等的技術。分區是一種“分而治之”的技術,通過將大表和索引分成可以管理的小塊,從而避免了對每個表作為一個大的、單獨的對象進行管理,為大量數據提供了可伸縮的性能。分區通過將操作分配給更小的存儲單元,減少了需要進行管理操作的時間,並通過增強的並行處理提高了性能,通過屏蔽故障數據的分區,還增加了可用性。
分區表:
當表中的數據量不斷增大,查詢數據的速度就會變慢,應用程序的性能就會下降,這時就應該考慮對表進行分區。表進行分區後,邏輯上表仍然是一張完整的表,只是將表中的數據在物理上存放到多個表空間(物理文件上),這樣查詢數據時,不至於每次都掃描整張表。
( 2).表分區的具體作用
Oracle的表分區功能通過改善可管理性、性能和可用性,從而為各式應用程序帶來了極大的好處。通常,分區可以使某些查詢以及維護操作的性能大大提高。此外,分區還可以極大簡化常見的管理任務,分區是構建千兆字節數據系統或超高可用性系統的關鍵工具。
分區功能能夠將表、索引或索引組織表進一步細分為段,這些數據庫對象的段叫做分區。每個分區有自己的名稱,還可以選擇自己的存儲特性。從數據庫管理員的角度來看,一個分區後的對象具有多個段,這些段既可進行集體管理,也可單獨管理,這就使數據庫管理員在管理分區後的對象時有相當大的靈活性。但是,從應用程序的角度來看,分區後的表與非分區表完全相同,使用 SQL DML 命令訪問分區後的表時,無需任何修改。
(3)什麼時候使用分區表:
1、表的大小超過2GB。
2、表中包含歷史數據,新的數據被增加都新的分區中。
優點:
增強可用性:如果表的某個分區出現故障,表在其他分區的數據仍然可用;
維護方便:如果表的某個分區出現故障,需要修復數據,只修復該分區即可;
均衡I/O:可以把不同的分區映射到磁盤以平衡I/O,改善整個系統性能;
改善查詢性能:對分區對象的查詢可以僅搜索自己關心的分區,提高檢索速度。
缺點:
分區表相關:已經存在的表沒有方法可以直接轉化為分區表。不過 Oracle提供了在線重定義表的功能。
范圍分區將數據基於范圍映射到每一個分區,這個范圍是你在創建分區時指定的分區鍵決定的。這種分區方式是最為常用的,並且分區鍵經常采用日期。舉個例子:你可能會將銷售數據按照月份進行分區。
當使用范圍分區時,請考慮以下幾個規則:
1、每一個分區都必須有一個VALUES LESS THEN子句,它指定了一個不包括在該分區中的上限值。分區鍵的任何值等於或者大於這個上限值的記錄都會被加入到下一個高一些的分區中。
2、所有分區,除了第一個,都會有一個隱式的下限值,這個值就是此分區的前一個分區的上限值。
3、在最高的分區中,MAXVALUE被定義。MAXVALUE代表了一個不確定的值。這個值高於其它分區中的任何分區鍵的值,也可以理解為高於任何分區中指定的VALUE LESS THEN的值,同時包括空值。
這類分區是在列值上使用散列算法,以確定將行放入哪個分區中。當列的值沒有合適的條件時,建議使用散列分區。
散列分區為通過指定分區編號來均勻分布數據的一種分區類型,因為通過在I/O設備上進行散列分區,使得這些分區大小一致。
hash分區最主要的機制是根據hash算法來計算具體某條紀錄應該插入到哪個分區中,hash算法中最重要的是hash函數,Oracle中如果你要使用hash分區,只需指定分區的數量即可。建議分區的數量采用2的n次方,這樣可以使得各個分區間數據分布更加均勻。
當你需要明確地控制如何將行映射到分區時,就使用列表分區方法。與范圍分區和散列分區所不同,列表分區不支持多列分區。如果要將表按列分區,那麼分區鍵就只能由表的一個單獨的列組成,然而可以用范圍分區或散列分區方法進行分區的所有的列,都可以用列表分區方法進行分區。該分區的特點是某列的值只有幾個,基於這樣的特點我們可以采用列表分區。
有時候我們需要根據范圍分區後,每個分區內的數據再散列地分布在幾個表空間中,這樣我們就要使用復合分區。復合分區是先使用范圍分區,然後在每個分區內再使用散列分區的一種分區方法(注意:先一定要進行范圍分區)
范圍和列表技術的組合,首先對表進行范圍分區,然後用列表技術對每個范圍分區再次分區。與組合范圍-散列分區不同的是,每個子分區的所有內容表示數據的邏輯子集,由適當的范圍和列表分區設置來描述。(注意:先一定要進行范圍分區)
select * from v$option s order by s.PARAMETER desc
例一:
假設有一個CUSTOMER表,表中有數據200000行,我們將此表通過CUSTOMER_ID進行分區,每個分區存儲100000行,我們將每個分區保存到單獨的表空間中,這樣數據文件就可以跨越多個物理磁盤。下面是創建表和分區的代碼,如下:
CREATE TABLE CUSTOMER
(
CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
FIRST_NAME VARCHAR2(30) NOT NULL,
LAST_NAME VARCHAR2(30) NOT NULL,
PHONE VARCHAR2(15) NOTNULL,
EMAIL VARCHAR2(80),
STATUS CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01,
PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02
)
例二:按時間劃分
CREATE TABLE ORDER_ACTIVITIES
(
ORDER_ID NUMBER(7) NOT NULL,
ORDER_DATE DATE,
TOTAL_AMOUNT NUMBER,
CUSTOTMER_ID NUMBER(7),
PAID CHAR(1)
)
PARTITION BY RANGE (ORDER_DATE)
(
PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY-2003','DD-MON-YYYY')) TABLESPACEORD_TS01,
PARTITION ORD_ACT_PART02 VALUES LESS THAN(TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02,
PARTITION ORD_ACT_PART02 VALUES LESS THAN(TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03
)
例三:MAXVALUE
CREATE TABLE RangeTable
(
idd INT PRIMARY KEY ,
iNAME VARCHAR(10),
grade INT
)
PARTITION BY RANGE (grade)
(
PARTITION part1 VALUES LESS THEN (1000) TABLESPACE Part1_tb,
PARTITION part2 VALUES LESS THEN (MAXVALUE) TABLESPACE Part2_tb
);
例一:
CREATE TABLE HASH_TABLE
(
COLNUMBER(8),
INFVARCHAR2(100)
)
PARTITION BY HASH (COL)
(
PARTITION PART01 TABLESPACE HASH_TS01,
PARTITION PART02 TABLESPACE HASH_TS02,
PARTITION PART03 TABLESPACE HASH_TS03
)
簡寫:
CREATE TABLE emp
(
empno NUMBER (4),
ename VARCHAR2 (30),
sal NUMBER
)
PARTITION BY HASH (empno) PARTITIONS 8
STORE IN(emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);
例一
CREATE TABLE PROBLEM_TICKETS
(
PROBLEM_ID NUMBER(7) NOT NULLPRIMARY KEY,
DESCRIPTION VARCHAR2(2000),
CUSTOMER_ID NUMBER(7) NOT NULL,
DATE_ENTERED DATE NOT NULL,
STATUS VARCHAR2(20)
)
PARTITION BY LIST (STATUS)
(
PARTITION PROB_ACTIVE VALUES('ACTIVE') TABLESPACE PROB_TS01,
PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02
例二
CREATE TABLE ListTable
(
id INT PRIMARY KEY ,
name VARCHAR (20),
area VARCHAR (10)
)
PARTITION BY LIST (area)
(
PARTITION part1 VALUES('guangdong','beijing') TABLESPACE Part1_tb,
PARTITION part2 VALUES('shanghai','nanjing') TABLESPACE Part2_tb
);
)
(1)范圍列表分區:
CREATE TABLE SALES
(
PRODUCT_ID VARCHAR2(5),
SALES_DATE DATE,
SALES_COST NUMBER(10),
STATUS VARCHAR2(20)
)
PARTITION BY RANGE(SALES_DATE) SUBPARTITIONBY LIST (STATUS)
(
PARTITION P1 VALUES LESSTHAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009
(
SUBPARTITION P1SUB1 VALUES('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P1SUB2 VALUES('INACTIVE') TABLESPACE rptfact2009
),
PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD'))TABLESPACE rptfact2009
(
SUBPARTITION P2SUB1 VALUES('ACTIVE') TABLESPACE rptfact2009,
SUBPARTITION P2SUB2 VALUES('INACTIVE') TABLESPACE rptfact2009
)
)
(2)范圍哈希分區:
create table dinya_test
(
transaction_id number primary key,
item_id number(8) not null,
item_description varchar2(300),
transaction_date date
)
partition byrange(transaction_date)subpartition by hash(transaction_id) subpartitions 3 store in(dinya_space01,dinya_space02,dinya_space03)
(
partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)),
partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)),
partition part_03 values less than(maxvalue)
);
一、添加分區
以下代碼給SALES表添加了一個P3分區
ALTER TABLE SALES ADD PARTITION P3 VALUESLESS THAN(TO_DATE('2003-06-01','YYYY-MM-DD'));
注意:以上添加的分區界限應該高於最後一個分區界限。
以下代碼給SALES表的P3分區添加了一個P3SUB1子分區
ALTER TABLE SALES MODIFY PARTITION P3 ADDSUBPARTITION P3SUB1 VALUES('COMPLETE');
二、刪除分區
以下代碼刪除了P3表分區:
ALTER TABLE SALES DROP PARTITION P3;
在以下代碼刪除了P4SUB1子分區:
ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
注意:如果刪除的分區是表中唯一的分區,那麼此分區將不能被刪除,要想刪除此分區,必須刪除表。
三、截斷分區
截斷某個分區是指刪除某個分區中的數據,並不會刪除分區,也不會刪除其它分區中的數據。當表中即使只有一個分區時,也可以截斷該分區。通過以下代碼截斷分區:
ALTER TABLE SALES TRUNCATE PARTITION P2;
通過以下代碼截斷子分區:
ALTER TABLE SALES TRUNCATE SUBPARTITIONP2SUB2;
四、合並分區
合並分區是將相鄰的分區合並成一個分區,結果分區將采用較高分區的界限,值得注意的是,不能將分區合並到界限較低的分區。以下代碼實現了P1 P2分區的合並:
ALTER TABLE SALES MERGE PARTITIONS P1,P2INTO PARTITION P2;
五、拆分分區
拆分分區將一個分區拆分兩個新分區,拆分後原來分區不再存在。注意不能對HASH類型的分區進行拆分。
ALTER TABLE SALES SBLIT PARTITION P2AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);
六、接合分區(coalesca)
結合分區是將散列分區中的數據接合到其它分區中,當散列分區中的數據比較大時,可以增加散列分區,然後進行接合,值得注意的是,接合分區只能用於散列分區中。通過以下代碼進行接合分區:
ALTER TABLE SALES COALESCA PARTITION;
七、重命名表分區
以下代碼將P21更改為P2
ALTER TABLE SALES RENAME PARTITION P21 TOP2;
八、相關查詢
跨分區查詢
select sum( *) from
(select count(*) cn from t_table_SSPARTITION (P200709_1)
union all
select count(*) cn from t_table_SSPARTITION (P200709_2)
);
查詢表上有多少分區
SELECT * FROM useR_TAB_PARTITIONS WHERETABLE_NAME='tableName'
查詢索引信息
selectobject_name,object_type,tablespace_name,sum(value)
from v$segment_statistics
where statistic_name IN ('physicalreads','physical write','logical reads')and object_type='INDEX'
group byobject_name,object_type,tablespace_name
order by 4 desc
--顯示數據庫所有分區表的信息:
select * from DBA_PART_TABLES
--顯示當前用戶可訪問的所有分區表信息:
select * from ALL_PART_TABLES
--顯示當前用戶所有分區表的信息:
select * from USER_PART_TABLES
--顯示表分區信息顯示數據庫所有分區表的詳細分區信息:
select * from DBA_TAB_PARTITIONS
--顯示當前用戶可訪問的所有分區表的詳細分區信息:
select * from ALL_TAB_PARTITIONS
--顯示當前用戶所有分區表的詳細分區信息:
select * from USER_TAB_PARTITIONS
--顯示子分區信息顯示數據庫所有組合分區表的子分區信息:
select * from DBA_TAB_SUBPARTITIONS
--顯示當前用戶可訪問的所有組合分區表的子分區信息:
select * from ALL_TAB_SUBPARTITIONS
--顯示當前用戶所有組合分區表的子分區信息:
select * from USER_TAB_SUBPARTITIONS
--顯示分區列顯示數據庫所有分區表的分區列信息:
select * from DBA_PART_KEY_COLUMNS
--顯示當前用戶可訪問的所有分區表的分區列信息:
select * from ALL_PART_KEY_COLUMNS
--顯示當前用戶所有分區表的分區列信息:
select * from USER_PART_KEY_COLUMNS
--顯示子分區列顯示數據庫所有分區表的子分區列信息:
select * from DBA_SUBPART_KEY_COLUMNS
--顯示當前用戶可訪問的所有分區表的子分區列信息:
select * from ALL_SUBPART_KEY_COLUMNS
--顯示當前用戶所有分區表的子分區列信息:
select * from USER_SUBPART_KEY_COLUMNS
--怎樣查詢出oracle數據庫中所有的的分區表
select * from user_tables a wherea.partitioned='YES'
--刪除一個表的數據是
truncate table table_name;
--刪除分區表一個分區的數據是
分區表和一般表一樣可以建立索引,分區表可以創建局部索引和全局索引。當分區中出現許多事務並且要保證所有分區中的數據記錄的唯一性時采用全局索引。全局索引建立時 global 子句允許指定索引的范圍值,這個范圍值為索引字段的范圍值。其實理論上有3中分區索引。
索引分區是在您建立了表分區後,要建索引就必須是建立索引分區。分2大類:一類是把索引信息建立在各個分區上,這叫局部索引分區(或叫本地索引分區)。另一類是把索引集中起來,叫全局索引。
對於 global 索引,可以選擇是否分區,而且索引的分區可以不與表分區相對應。當對分區進行維護操作時,通常會導致全局索引的 Invalid,必須在執行完操作後 Rebuild。Oracle9i 提供了 Update Global Indexes 語句,可以在進行分區維護的同時重建全局索引。
1:索引信息的存放位置與父表的Partition(分區)信息完全不相干。甚至父表是不是分區表都無所謂的。
create indexdinya_idx_t on dinya_test(item_id) global partition by range(item_id) (
partition idx_1values less than (1000) tablespace dinya_space01,
partition idx_2values less than (10000) tablespace dinya_space02,
partition idx_3values less than (maxvalue) tablespace dinya_space03
);
2:但是在這種情況下,如果父表是分區表,要刪除父表的一個分區都必須要更新GlobalIndex ,否則索引信息不正確
ALTER TABLETableName DROP PARTITION PartitionName Update Global Indexes
建立方法:
create index ind_2on sales (amount_sold)
global partitionby range (amount_sold)
(partition d1 ,
partition d2);
因為全局索引的首個字段必須是range字段,所以就無所謂前綴和非前綴了,都是前綴。
經過試驗,我覺得建立全局索引的速度要略遜於局部前綴索引。
也可能是我的能力問題,現在覺得建立分區還不然不建立索引。如果大家能給我解惑
對於 local 索引,每一個表分區對應一個索引分區(就是說一個分區表一個字段只可以建一個局部索引),當表的分區發生變化時,索引的維護由 Oracle 自動進行;
1:索引信息的存放位置依賴於父表的Partition(分區)信息,換句話說創建這樣的索引必須保證父表是Partition(分區),索引信息存放在父表的分區所在的表空間。
2:但是僅可以創建在父表為HashTable或者composite分區表的。
3:僅可以創建在父表為HashTable或者composite分區表的。並且指定的分區數目要與父表的分區數目要一致。
create indexdinya_idx_t on dinya_test(item_id) local (
partition idx_1 tablespace dinya_space01,
partition idx_2 tablespace dinya_space02,
partition idx_3 tablespace dinya_space03
);
不指定索引分區名直接對整個表建立索引
create indexdinya_idx_t on dinya_test(item_id);
建立方法:
create index ind_1on dept (deptno)
local
(partition d1 ,
partition d2);
(1)局部前綴索引分區和局部非前綴分區。如果您擬建立的索引的首個字段,和進行分區時的range列一樣,那就是局部前綴索引分區。
優點是:理論上(我認為的),比方說您以年代為range分區,2007年一個分區、2008年一個分區,然後您又在這個時間列上建立了局部前綴索引分區,那麼ORACLE就會直接利用這個區上的索引僅進行這個分區上的搜索,所以效率會很高。
在我建立的2000萬的表中進行查詢,實踐是,這個局部前綴復合索引的花銷cost是5,而沒有分區前是4。當然這也無所謂了。又進行了其他幾個查詢,其cost都相差無幾。
(2)局部非前綴索引。如果您建立索引的列的首個字段不是range列,那麼就叫局部非前綴索引。
優點是:如果您查一個電話號碼,它在每年都會出現,當您要count匯總時,這種索引就會同時把這幾個分區進行並行處理查詢,速度理論上要快。
但我的試驗比較令我失望:我建了一個2000萬的無分區的表,然後把這個表又復制了一遍,進行了6個分區。但結果在對某列進行查詢統計時,如果在一個分區,兩者速度相差不大,分區的查詢速度是:0.25m,無分區的查詢速度是:0.065m。但在我期望的跨區統計時,分區的第一次統計時間是:61.875m,第二次是:10m;而無分區的表僅為:3.703m。