一個SQL語句的關聯表超過兩個,那麼連接的順序如何呢?ORACLE首先連接其中的兩個表,產生一個結果集;然後將產生的結果集與下一個表再進行關聯;繼續這個過程,直到所有的表都連接完成;最後產生所需的數據,,本文將主要從以下幾個典型的例子來分析Oracle表的幾種不同連接方式:
1. 相等連接
通過兩個表具有相同意義的列,可以建立相等連接條件。
只有連接列上在兩個表中都出現且值相等的行才會出現在查詢結果中。
例 查詢員工信息以及對應的員工所在的部門信息;
- SELECT * FROM EMP,DEPT;
- SELECT * FROM EMP,DEPT
- WHERE EMP.DEPTNO = DEPT.DEPTNO;
REM 顯示工資超過2000的員工信息以及對應的員工的部門名稱。
2. 外連接
對於外連接,Oracle中可以使用“(+)”來表示,9i可以使用LEFT/RIGHT/FULL OUTER JOIN,下面將配合實例一一介紹。除了顯示匹配相等連接條件的信息之外,還顯示無法匹配相等連接條件的某個表的信息。
外連接采用(+)來識別。
◆左條件(+) = 右條件;
代表除了顯示匹配相等連接條件的信息之外,還顯示右條件所在的表中無法匹配相等連接條件的信息。
此時也稱為"右外連接".另一種表示方法是:
SELECT ... FROM 表1 RIGHT OUTER JOIN 表2 ON 連接條件
◆左條件 = 右條件(+);
代表除了顯示匹配相等連接條件的信息之外,還顯示左條件所在的表中無法匹配相等連接條件的信息。
此時也稱為"左外連接".
SELECT ... FROM 表1 LEFT OUTER JOIN 表2 ON 連接條件
例 顯示員工信息以及所對應的部門信息
--無法顯示沒有部門的員工信息
--無法顯示沒有員工的部門信息
--SELECT * FROM EMP,DEPT WHERE EMP.DEPTNO = DEPT.DEPTNO;
--直接做相等連接:
SELECT * FROM EMP JOIN DEPT ON EMP.DEPTNO = DEPT.DEPTNO;
REM 顯示員工信息以及所對應的部門信息,顯示沒有員工的部門信息
--SELECT * FROM EMP,DEPT WHERE EMP.DEPTNO(+) = DEPT.DEPTNO;
SELECT * FROM EMP RIGHT OUTER JOIN DEPT ON EMP.DEPTNO = DEPT.DEPTNO;
REM 顯示員工信息以及所對應的部門信息,顯示沒有部門的員工信息
--SELECT * FROM EMP,DEPT WHERE EMP.DEPTNO = DEPT.DEPTNO(+);
SELECT * FROM EMP LEFT OUTER JOIN DEPT ON EMP.DEPTNO = DEPT.DEPTNO;
3. 不等連接
兩個表中的相關的兩列進行不等連接,比較符號一般為>,<,...,BETWEEN.. AND..
REM SALGRADE
--DESC SALGRADE;
--SELECT * FROM SALGRADE;
REM 顯示員工的編號,姓名,工資,以及工資所對應的級別。
SELECT EMPNO,ENAME,SAL,SALGRADE.* FROM SALGRADE,EMP
WHERE EMP.SAL BETWEEN LOSAL AND HISAL;
REM 顯示雇員的編號,姓名,工資,工資級別,所在部門的名稱;
SELECT EMPNO,ENAME,SAL,GRADE,DNAME FROM EMP,DEPT,SALGRADE
WHERE EMP.DEPTNO = DEPT.DEPTNO AND EMP.SAL BETWEEN LOSAL AND HISAL;
4. 自連接
自連接是數據庫中經常要用的連接方式,使用自連接可以將自身表的一個鏡像當作另一個表來對待,從而能夠得到一些特殊的數據。下面介紹一下自連接的方法:
將原表復制一份作為另一個表,兩表做笛卡兒相等連接。
例 顯示雇員的編號,名稱,以及該雇員的經理名稱
SELECT WORKER.ENAME,WORKER.MGR,MANAGER.EMPNO,MANAGER.ENAME FROM EMP WORKER,EMP MANAGER
WHERE WORKER.MGR = MANAGER.EMPNO;
5.哈希連接
當內存能夠提供足夠的空間時,哈希(HASH)連接是Oracle優化器通常的選擇。哈希連接中,優化器根據統計信息,首先選擇兩個表中的小表,在內存中建立這張表的基於連接鍵的哈希表;優化器再掃描表連接中的大表,將大表中的數據與哈希表進行比較,如果有相關聯的數據,則將數據添加到結果集中。
當表連接中的小表能夠完全cache到可用內存的時候,哈希連接的效果最佳。哈希連接的成本只是兩個表從硬盤讀入到內存的成本。
但是,如果哈希表過大而不能全部cache到可用內存時,優化器將會把哈希表分成多個分區,再將分區逐一cache到內存中。當表的分區超過了可用內存時,分區的部分數據就會臨時地寫到磁盤上的臨時表空間上。因此,分區的數據寫磁盤時,比較大的區間(EXTENT)會提高I/O性能。Oracle推薦的臨時表空間的區間是1MB。臨時表空間的區間大小由UNIFORM SIZE指定。
當哈希表構建完成後,進行下面的處理:
1) 第二個大表進行掃描
2) 如果大表不能完全cache到可用內存的時候,大表同樣會分成很多分區
3) 大表的第一個分區cache到內存
4) 對大表第一個分區的數據進行掃描,並與哈希表進行比較,如果有匹配的紀錄,添加到結果集裡面
5) 與第一個分區一樣,其它的分區也類似處理。
6) 所有的分區處理完後,Oracle對產生的結果集進行歸並,匯總,產生最終的結果。
當哈希表過大或可用內存有限,哈希表不能完全CACHE到內存。隨著滿足連接條件的結果集的增加,可用內存會隨之下降,這時已經CACHE到內存的數據可能會重新寫回到硬盤去。如果出現這種情況,系統的性能就會下降。
當連接的兩個表是用等值連接並且表的數據量比較大時,優化器才可能采用哈希連接。哈希連接是基於CBO的。只有在數據庫初始化參數HASH_JOIN_ENABLED設為True,並且為參數PGA_AGGREGATE_TARGET設置了一個足夠大的值的時候,Oracle才會使用哈希邊連接。HASH_AREA_SIZE是向下兼容的參數,但在Oracle9i之前的版本中應當使用HASH_AREA_SIZE。當使用ORDERED提示時,FROM子句中的第一張表將用於建立哈希表。
- select a.user_name,b.dev_no
- from user_info a, dev_info b
- where a.user_id = b.user_id;
- Plan
- ----------------------------------------------------------
- 0 SELECT STATEMENT Optimizer=CHOOSE (Cost=5 Card=82 Bytes=3936
- )
- 1 0 HASH JOIN (Cost=5 Card=82 Bytes=3936)
- 2 1 TABLE Access (FULL) OF 'USER_INFO' (Cost=2 Card=82 Bytes
- =1968)
- 3 1 TABLE Access (FULL) OF 'DEV_INFO' (Cost=2 Card=82 Bytes=
- 1968)
可以通過在SQL語句中添加HINTS,強制Oracle優化器產生哈希連接的執行計劃。
- select /*+ use_hash(a b)*/ a.user_name,b.dev_no
- from user_info a, dev_info b
- where a.user_id = b.user_id;
當缺少有用的索引時,哈希連接比嵌套循環連接更加有效。哈希連接也可能比嵌套循環連接更快,因為處理內存中的哈希表比檢索B_樹索引更加迅速。