程式師世界 >> 數據庫知識 >> Oracle數據庫 >> Oracle教程 >> Oracle的FORALL用法（批量增刪改）

Oracle的FORALL用法（批量增刪改）

編輯：Oracle教程

Oracle的FORALL用法（批量增刪改）

FORALL語句的一個關鍵性改進，它可大大簡化代碼，並且對於那些要在PL/SQL程序中更新很多行數據的程序來說，它可顯著提高其性能。

1:
用FORALL來增強DML的處理能力
Oracle為Oracle8i中的PL/SQL引入了兩個新的數據操縱語言（DML）語句：BULK COLLECT和FORALL。這兩個語句在PL/SQL內部進行一種數組處理

；BULK COLLECT提供對數據的高速檢索，FORALL可大大改進INSERT、UPDATE和DELETE操作的性能。Oracle數據庫使用這些語句大大減少了

PL/SQL與SQL語句執行引擎的環境切換次數，從而使其性能有了顯著提高。

使用BULK COLLECT，你可以將多個行引入一個或多個集合中，而不是單獨變量或記錄中。下面這個BULK COLLECT的實例是將標題中包含

有"PL/SQL"的所有書籍檢索出來並置於記錄的一個關聯數組中，它們都位於通向該數據庫的單一通道中。

DECLARE
TYPE books_aat

IS TABLE OF book%ROWTYPE
INDEX BY PLS_INTEGER;
books books_aat;
BEGIN
SELECT *
BULK COLLECT INTO book
FROM books
WHERE title LIKE '%PL/SQL%';
...
END;

類似地，FORALL將數據從一個PL/SQL集合傳送給指定的使用集合的表。下面的代碼實例給出一個過程，即接收書籍信息的一個嵌套表，並將該

集合（綁定數組）的全部內容插入該書籍表中。注意，這個例子還利用了Oracle9i的FORALL的增強功能，可以將一條記錄直接插入到表中。

BULK COLLECT和FORALL都非常有用，它們不僅提高了性能，而且還簡化了為PL/SQL中的SQL操作所編寫的代碼。下面的多行FORALL INSERT相當

清楚地說明了為什麼PL/SQL被認為是Oracle數據庫的最佳編程語言。

CREATE TYPE books_nt
IS TABLE OF book%ROWTYPE;
/
CREATE OR REPLACE PROCEDURE add_books (

books_in IN books_nt)
IS
BEGIN
FORALL book_index
IN books_in.FIRST .. books_in.LAST
INSERT INTO book
VALUES books_in(book_index);
...
END;

不過在Oracle數據庫10g之前，以FORAll方式使用集合有一個重要的限制：該數據庫從IN范圍子句中的第一行到最後一行，依次讀取集合的內容

。如果在該范圍內遇到一個未定義的行，Oracle數據庫將引發ORA-22160異常事件：

ORA-22160: element at index [N] does not exist

對於FORALL的簡單應用，這一規則不會引起任何麻煩。但是，如果想盡可能地充分利用FORALL，那麼要求任意FORALL驅動數組都要依次填充可

能會增加程序的復雜性並降低性能。

在Oracle數據庫10g中，PL/SQL現在在FORALL語句中提供了兩個新子句：INDICES OF與VALUES OF，它們使你能夠仔細選擇驅動數組中該由擴展

DML語句來處理的行。
當綁定數組為稀疏數組或者包含有間隙時，INDICES OF會非常有用。該語句的語法結構為：

FORALL indx IN INDICES

OF sparse_collection
INSERT INTO my_table
VALUES sparse_collection (indx);

VALUES OF用於一種不同的情況：綁定數組可以是稀疏數組，也可以不是，但我只想使用該數組中元素的一個子集。那麼我就可以使用VALUES

OF來指向我希望在DML操作中使用的值。該語句的語法結構為：

FORALL indx IN VALUES OF pointer_array
INSERT INTO my_table
VALUES binding_array (indx);

不用FOR循環而改用FORALL
假定我需要編寫一個程序，對合格員工（由comp_analysis.is_eligible函數確定）加薪，編寫關於不符合加薪條件的員工的報告並寫入

employee_history表。我在一個非常大的公司工作；我們的員工非常非常多。

對於一位PL/SQL開發人員來說，這並不是一項十分困難的工作。我甚至不需要使用BULK COLLECT或FORALL就可以完成這項工作，如清單 1所示

，我使用一個CURSOR FOR循環和單獨的INSERT及UPDATE語句。這樣的代碼簡潔明了；不幸地是，我花了10分鐘來運行此代碼，我的"老式"方法

要運行30分鐘或更長時間。
清單 1:

CREATE OR REPLACE PROCEDURE give_raises_in_department (
dept_in IN employee.department_id%TYPE
, newsal IN employee.salary%TYPE
)
IS
CURSOR emp_cur
IS
SELECT employee_id, salary, hire_date
FROM employee
WHERE department_id = dept_in;
BEGIN
FOR emp_rec IN emp_cur
LOOP
IF comp_analysis.is_eligible (emp_rec.employee_id)
THEN
UPDATE employee
SET salary = newsal
WHERE employee_id = emp_rec.employee_id;
ELSE
INSERT INTO employee_history
(employee_id, salary
, hire_date, activity
)
VALUES (emp_rec.employee_id, emp_rec.salary
, emp_rec.hire_date, 'RAISE DENIED'
);
END IF;
END LOOP;
END give_raises_in_department;

好在我公司的數據庫升級到了Oracle9i，而且更幸運的是，在最近的Oracle研討會上（以及Oracle技術網站提供的非常不錯的演示中）我了解

到了批量處理方法。所以我決定使用集合與批量處理方法重新編寫程序。寫好的程序如清單 2所示。
清單 2:

 CREATE OR REPLACE PROCEDURE give_raises_in_department (
 dept_in IN employee.department_id%TYPE
 , newsal IN employee.salary%TYPE
 )
 IS
 TYPE employee_aat IS TABLE OF employee.employee_id%TYPE
 INDEX BY PLS_INTEGER;
 TYPE salary_aat IS TABLE OF employee.salary%TYPE
INDEX BY PLS_INTEGER;
TYPE hire_date_aat IS TABLE OF employee.hire_date%TYPE
 INDEX BY PLS_INTEGER;

 employee_ids employee_aat;
salaries salary_aat;
 hire_dates hire_date_aat;
 approved_employee_ids employee_aat;
 denied_employee_ids employee_aat;
denied_salaries salary_aat;
 denied_hire_dates hire_date_aat;
PROCEDURE retrieve_employee_info
 IS
 BEGIN
 SELECT employee_id, salary, hire_date
 BULK COLLECT INTO employee_ids, salaries, hire_dates
 FROM employee
 WHERE department_id = dept_in;
 END;
 PROCEDURE partition_by_eligibility
 IS
 BEGIN
 FOR indx IN employee_ids.FIRST .. employee_ids.LAST
 LOOP
 IF comp_analysis.is_eligible (employee_ids (indx))
 THEN
approved_employee_ids (indx) := employee_ids (indx);
ELSE
 denied_employee_ids (indx) := employee_ids (indx);
 denied_salaries (indx) := salaries (indx);
 denied_hire_dates (indx) := hire_dates (indx);
 END IF;
 END LOOP;
END;

 PROCEDURE add_to_history
 IS
 BEGIN
 FORALL indx IN denied_employee_ids.FIRST .. denied_employee_ids.LAST
 INSERT INTO employee_history
 (employee_id
 , salary
 , hire_date, activity
 )
 VALUES (denied_employee_ids (indx)
 , denied_salaries (indx)
 , denied_hire_dates (indx), 'RAISE DENIED'
 );
 END;

 PROCEDURE give_the_raise
 IS
 BEGIN
 FORALL indx IN approved_employee_ids.FIRST .. approved_employee_ids.LAST
UPDATE employee
 SET salary = newsal
 WHERE employee_id = approved_employee_ids (indx);
 END;
 BEGIN
 retrieve_employee_info;
 partition_by_eligibility;
add_to_history;
give_the_raise;
END give_raises_in_department;

掃一眼清單1 和清單2 就會清楚地認識到：改用集合和批量處理方法將增加代碼量和復雜性。但是，如果你需要大幅度提升性能，這還是值得

的。下面，我們不看這些代碼，我們來看一看當使用FORALL時，用什麼來處理CURSOR FOR循環內的條件邏輯。

定義集合類型與集合

在清單 2中，聲明段的第一部分（第6行至第11行）定義了幾種不同的集合類型，與我將從員工表檢索出的列相對應。我更喜歡基於employee%

ROWTYPE來聲明一個集合類型，但是FORALL還不支持對某些記錄集合的操作，在這樣的記錄中，我將引用個別字段。所以，我還必須為員工ID、

薪金和雇用日期分別聲明其各自的集合。

接下來為每一列聲明所需的集合（第13行至第21行）。首先定義與所查詢列相對應的集合（第13行至第15行）：

employee_ids employee_aat;
salaries salary_aat;
hire_dates hire_date_aat;

然後我需要一個新的集合，用於存放已被批准加薪的員工的ID（第17行）：

approved_employee_ids employee_aat;

最後，我再為每一列聲明一個集合（第19行至第21行），用於記錄沒有加薪資格的員工：

denied_employee_ids employee_aat;
denied_salaries salary_aat;
denied_hire_dates hire_date_aat;

深入了解代碼

數據結構確定後，我們現在跳過該程序的執行部分（第72行至第75行），了解如何使用這些集合來加速進程。

retrieve_employee_info;
partition_by_eligibility;
add_to_history;
give_the_raise;

我編寫此程序使用了逐步細化法（也被稱為"自頂向下設計"）。所以執行部分不是很長，也不難理解，只有四行，按名稱對過程中的每一步進

行了描述。首先檢索員工信息（指定部門的所有員工）。然後進行劃分，將要加薪和不予加薪的員工區分出來。完成之後，我就可以將那些不

予加薪的員工添加至員工歷史表中，對其他員工進行加薪。

以這種方式編寫代碼使最終結果的可讀性大大增強。因而我可以深入到該程序中對我有意義的任何部分。

有了已聲明的集合，我現在就可以使用BULK COLLECT來檢索員工信息（第23行至第30行）。這一部分有效地替代了CURSOR FOR循環。至此，數

據被加載到集合中。

劃分邏輯（第32行至第46行）要求對剛剛填充的集合中的每一行進行檢查，看其是否符合加薪條件。如果符合，我就將該員工ID從查詢填充的

集合復制到符合條件的員工的集合。如果不符合，則復制該員工ID、薪金和雇用日期，因為這些都需要插入到employee_history表中。

初始數據現在已被分為兩個集合，可以將其分別用作兩個不同的FORALL語句（分別從第51行和第66行開始）的驅動器。我將不合格員工的集合

中的數據批量插入到employee_history（add_to_history）表中，並通過give_the_raise過程，在employee表中批量更新合格員工的信息。

最後再仔細地看一看add_to_history（第48行至第61行），以此來結束對這個重新編寫的程序的分析。FORALL語句（第51行）包含一個IN子句

，它指定了要用於批量INSERT的行號范圍。在對程序進行第二次重寫的說明中，我將把用於定義范圍的集合稱為"驅動集合"。但在

add_to_history的這一版本中，我簡單地假定：使用在denied_employee_ids中定義的所有行。在INSERT自身內部，關於不合格員工的三個集

合都會被用到；我將把這些集合稱為"數據集合"。可以看到，驅動集合與數據集合無需匹配。在學習Oracle數據庫10g的新特性時，這是一個關

鍵點。

結果，清單 2 的行數大約是清單 1行數的2倍，但是清單 2 中的代碼會在要求的時間內運行。在使用Oracle數據庫10g之前，在這種情況下，

我只會對能夠在這一時間內運行代碼並開始下一個任務這一點感到高興。

不過，有了Oracle數據庫10g中最新版的PL/SQL，現在我就可以在性能、可讀性和代碼量方面作出更多的改進。
將VALUES OF用於此過程

在Oracle數據庫10g中，可以指定FORALL語句使用的驅動集合中的行的子集。可以使用以下兩種方法之一來定義該子集：

將數據集合中的行號與驅動集合中的行號進行匹配。你需要使用INDICES OF子句。
將數據集合中的行號與驅動集合中所定義行中找到的值進行匹配。這需要使用VALUES OF子句。
在對give_raises_in_department進行第二次和最後一次改寫中我將使用VALUES OF子句。清單 3 包含這個版本的全部代碼。我將略過這一程序

中與前一版本相同的部分。

從聲明集合開始，請注意我不再另外定義集合來存放合格的和不合格的員工信息，而是在清單 3 （第17行至第21行）中聲明兩個"引導"集合：

一個用於符合加薪要求的員工，另一個用於不符合加薪要求的員工。這兩個集合的數據類型都是布爾型；不久將會看到，這些集合的數據類型

與FORALL語句毫無關系。FORALL語句只關心定義了哪些行。在員工表中擁有50 000行信息的give_raises_in_department的三種執行方法的占

用時間執行方法用時
CURSOR FOR循環 00:00:38.01
Oracle數據庫10g之前的批量處理 00:00:06.09
Oracle數據庫10g的批量處理 00:00:02.06

在員工表中擁有100,000行數據的give_raises_in_department的三種執行方法的占用時間執行方法用時
CURSOR FOR循環 00:00:58.01
Oracle數據庫10g之前的批量處理 00:00:12.00
Oracle數據庫10g的批量處理 00:00:05.05

表1：處理50,000行和100,000行數據的用時測試結果

retrieve_employee_info子程序與前面的相同，但是對數據進行劃分的方式完全不同（第32行至第44行）。我沒有將記錄從一個集合復制到另

一個集合（這個操作相對較慢），而只是確定與員工ID集合中的行號相匹配的相應引導集合中的行（通過為其指定一個TRUE值）。

現在可以在兩個不同FORALL語句（由第49行和第65行開始）中，將approved_list和denied_list集合用作驅動集合。

為了插入到employee_history表中，我使用了如下語句：

FORALL indx IN VALUES OF denied_list