我們今天是要和大家一起討論的是DB2 V9.7 分區索引空間占用和掃描性能,我們大家都知道分區表主要是應用在表比較大的背景下,所以我們使用大表才能測試出性能。下面我們創建測試表。
清單 7. 創建測試大表
- drop table t1;
- CREATE TABLE t1
- ( l_orderkey INTEGER NOT NULL, l_partkey
- INTEGER, l_suppkey INTEGER, l_shipdate date, padding1 char(30)
- )
- PARTITION BY RANGE(l_shipdate)
- (
- STARTING '2008-01-01' ENDING '2008-12-31' EVERY 1 MONTH
- )
- ;
- INSERT INTO t1 (l_orderkey, l_partkey, l_suppkey,l_shipdate,padding1)
- WITH TEMP (COUNTER, l_orderkey, l_partkey, l_suppkey,l_shipdate,padding1) AS
- ( VALUES (0, MOD(INT(RAND() * 12000000), 25), MOD(INT(RAND() * 12000000), 30),
- MOD(INT(RAND() * 12000000), 30), DATE(MOD(INT(RAND() * 12000000), 366)+733042), 'A')
- UNION ALL SELECT (COUNTER + 1), MOD(INT(RAND() * 12000000), 25),
- MOD(INT(RAND() * 12000000), 30), MOD(INT(RAND() * 12000000), 30),
- DATE(MOD(INT(RAND() * 12000000), 366)+733042), 'A' FROM TEMP
- WHERE (COUNTER + 1) < 12000000
- )
- SELECT l_orderkey, l_partkey, l_suppkey,l_shipdate,padding1
- FROM TEMP
- ;
我們創建的表包含 1200 萬行數據,按照月份每個月一個分區,分區列 l_shipdate 的數據分布在’ 2008-01-01 ’和’ 2008-12-31 ’之間,且均勻分布。注意 733042 是日期 2008-01-01 在 DB2 內以天數的表達形式,是通過 days() 函數獲得的。
我們首先在列 l_orderkey 上創建非DB2 V9.7 分區索引。
清單 8. 創建非分區索引
- db2 "Create index idx_nopart_l_orderkey on t1(l_orderkey) not partitioned"
- db2 "runstats on table db2inst1.t1 and indexes all"
- db2 "select substr(INDNAME,1,25) idx_name,NLEVELS,NLEAF,INDCARD
- from syscat.indexes where tabname='T1'"
- DX_NAME NLEVELS NLEAF INDCARD
- IDX_NOPART_L_ORDERKEY 3 16831 12000000
清單 8 表明,非分區索引 B 樹高度為 3 層,具有 16831 個葉子頁面。
清單 9. 測試非DB2 V9.7 分區索引性能
- db2 set current explain mode yes
- db2 values current timestamp
- 1
- 2009-07-07-15.46.24.863000
- db2 "select count(*) from t1 "
- 1
- ----------- 12000000
- db2 values current timestamp
- 1
- 2009-07-07-15.46.27.394000
- db2exfmt -d sample -w -1 -n % -s % -# 0 -t
- Total Cost: 24109.7
- Query Degree: 1
- Rows RETURN ( 1) Cost I/O
- | 1 GRPBY ( 2) 24109.7 17002 | 1.2e+007 IXSCAN ( 3) 23259.5 17002 | 1.2e+007
- INDEX: ADMINISTRATOR
- IDX_NOPART_L_ORDERKEY Q1
清單 9 表明使用索引 IDX_NOPART_L_ORDERKEY 統計表 T1 的總行數時,估計總成本為 24109.7,IO 次數估計為 17002,實際花費時間為 2.45 秒。
清單 10. 創建分區索引
- db2 "Create index idx_part_l_orderkey on t1(l_orderkey) partitioned"
- db2 "runstats on table db2inst1.t1 and indexes all"
- db2 "select substr(INDNAME,1,25) idx_name,DATAPARTITIONID,NLEVELS,NLEAF,INDCARD
- from syscat.indexpartitions"
- IDX_NAME DATAPARTITIONID NLEVELS NLEAF INDCARD
- IDX_PART_L_ORDERKEY 0 3 1134 1021133
- IDX_PART_L_ORDERKEY 1 3 1062 956131
- IDX_PART_L_ORDERKEY 2 3 1136 1023293
- IDX_PART_L_ORDERKEY 3 3 1098 988650
- IDX_PART_L_ORDERKEY 4 3 1134 1021552
- IDX_PART_L_ORDERKEY 5 3 1100 990715
- IDX_PART_L_ORDERKEY 6 3 1134 1020850
- IDX_PART_L_ORDERKEY 7 3 1137 1023727
- IDX_PART_L_ORDERKEY 8 3 1101 991839
- IDX_PART_L_ORDERKEY 9 3 1133 1020225
- IDX_PART_L_ORDERKEY 10 3 1078 970906
- IDX_PART_L_ORDERKEY 11 3 1078 970979
清單 10 表明,分區索引 idx_part_l_orderkey 具有 12 個分區,B 樹高度為 3 層,合計具有 13325 個葉子頁面,葉子頁面數比非分區索引下降 20% 。
清單 11. 測試DB2 V9.7 分區索引性能
- db2 set current explain mode yes
- db2 values current timestamp
- 1
- 2009-07-07-15.59.09.722000
- db2 "select count(*) from t1 "
- 1
- ----------- 12000000
- db2 values current timestamp
- 1
- 2009-07-07-15.59.11.910000
- db2exfmt -d sample -w -1 -n % -s % -# 0 -t
- Total Cost: 24109.7
- Query Degree: 1 Total Cost: 22059.4
- Query Degree: 1
- Rows RETURN ( 1) Cost I/O | 1 GRPBY ( 2)
- 22059.4 14178.4 | 1.2e+007 IXSCAN ( 3) 21209.2 14178.4 | 1.2e+007
- INDEX: ADMINISTRATOR
- IDX_PART_L_ORDERKEY Q1
清單 11 表明使用索引 IDX_PART_L_ORDERKEY 統計表 T1 的總行數時,估計總成本為 22059.4,比非分區索引下降 8.5%,IO 次數估計為 14178.4,比非分區索引下降 16%, 實際花費時間為 2.19 秒,比非分區索引下降 10% 。
上述測試表明,DB2 V9.7 分區索引在空間占用、掃描性能方面比非分區索引具有一定的性能優勢。