程式師世界 >> 數據庫知識 >> Oracle數據庫 >> Oracle數據庫基礎 >> 詳細介紹 Oracle 數據庫的聚簇技術

詳細介紹 Oracle 數據庫的聚簇技術

編輯：Oracle數據庫基礎

1. 什麼是聚簇

聚簇是根據碼值找到數據的物理存儲位置，從而達到快速檢索數據的目的。聚簇索引的順序就是數據的物理存儲順序，葉節點就是數據節點。非聚簇索引的順序與數據物理排列順序無關，葉節點仍然是索引節點，只不過有一個指針指向對應的數據塊。一個表最多只能有一個聚簇索引。

2. 使用 Oracle 聚簇索引

聚簇是一種存儲表的方法，這些表密切相關並經常一起連接進磁盤的同一區域。例如，表 BOOKSHELF 和BOOKSHELF_AUTHOR 數據行可以一起插入到稱為簇（Cluster）的單個區域中，而不是將兩個表放在磁盤上的不同扇區上。簇鍵（Cluster Key）可以是一列或多列，通過這些列可以將這些表在查詢中連接起來（例如，BOOKSHELF表和BOOKSHELF_AUTHOR表中的 Title列）。為了將表聚集在一起，必須擁有這些將要聚集在一起的表。

下面是create cluster命令的基本格式：

create cluster (column datatype [, column datatype]...) [other options];

cluster的名字遵循表命名約定，column datatype是將作為簇鍵使用的名字和數據類型。column的名字可以與將要放進該簇中的表的一個列名相同，或者為其他有效名字。下面是一個例子：

create cluster BOOKandAUTHOR (Col1 VARCHAR2(100));

這樣就建立了一個沒有任何內容的簇（象給表分配了一塊空間一樣）。COL1的使用對於簇鍵是不相干的，不會再使用它。但是，它的定義應該與要增加的表的主鍵相符。接下來，建立包含在該簇中的表：

create table BOOKSHELF
    (Title VARCHAR2(100) primary key,
    Publisher VARCHAR2(20),
    CategoryName VARCHAR2(20),
    Rating VARCHAR2(2),
    constraint CATFK foreign key (CategoryName) references CATEGORY(CategoryName)
    )
    cluster BOOKandAUTHOR(Title);

在向BOOKSHELF表中插入數據行之前，必須建立一個聚簇索引：

create index BOOKandAUTHORndx on cluster BOOKandAUTHOR;

在上面的create table語句中，簇BOOKandAUTHOR(Title)子句放在表的列清單的閉括號的後面。BOOKandAUTHOR是前面建立的聚簇的名字。Title是將存儲到聚簇Col1中的該表的列。create cluster語句中可能會有多個簇鍵，並且在created table語句中可能有多個列存儲在這些鍵中。請注意，沒有任何語句明確說明Title列進入到Col1中。這種匹配僅僅是通過位置做到的，即Col1和Title都是在它們各自的簇語句中提到的第一個對象。多個列和簇鍵是第一個與第一個匹配，第二個與第二個匹配，第三個與第三個匹配，等等。現在，添加第二個表到聚簇中：

create table BOOKSHELF_AUTHOR
    (Title VARCHAR2(100),
    AuthorName VARCHAR2(50),
    constraint TitleFK Foreign key (Title) references BOOKSHELF(Title),
    constraint AuthorNameFK Foreign key (AuthorName) references AUTHOR(AuthorName)
    )
    cluster BOOKandAUTHOR (Title);

當這兩個表被聚在一起時，每個唯一的Title在簇中實際只存儲一次。對於每個Title，都從這兩個表中附加列。

來自這兩個表的數據實際上存放在一個位置上，就好像簇是一個包含兩個表中的所有數據的大表一樣。

3. 散列聚簇

對於散列聚簇，它只有一個表。它通過散列算法求出存儲行的物理存儲位置，從而快速檢索數據。創建散列聚簇時要指定碼列的數據類型，數據行的大小及不同碼值的個數。如果碼值不是平均分布的，就可能有許多行存儲到溢出塊上，從而會降低查詢該表的SQL語句的性能。

散列聚簇被用在總是通過主鍵查詢數據的情況，例如要從表 T 查詢數據並且查詢語句總是是這樣：

select * from T where id = :x;

這時散列聚簇是一個好的選擇，因為不需要索引。Oracle 將通過散列算法得到值 :x 所對應的物理地址，從而直接取到數據。不用進行索引掃描，只通過散列值進行一次表訪問。

散列聚簇語法示例：

CREATE CLUSTER personnel
    ( department_number NUMBER )
    SIZE 512 HASHKEYS 500
    STORAGE (INITIAL 100K NEXT 50K);

    CREATE CLUSTER personnel
    ( home_area_code NUMBER,
    home_prefix NUMBER )
    HASHKEYS 20
    HASH IS MOD(home_area_code + home_prefix, 101);
    CREATE CLUSTER personnel
    (deptno NUMBER)
    SIZE 512 SINGLE TABLE HASHKEYS 500;