程式師世界 >> 數據庫知識 >> DB2數據庫 >> DB2數據庫綜合 >> 在DB2中提高INSERT性能的技巧(1)

在DB2中提高INSERT性能的技巧(1)

編輯：DB2數據庫綜合

正在看的db2教程是:在DB2中提高INSERT性能的技巧(1)。

INSERT 處理過程概述

首先讓我們快速地看看插入一行時的處理步驟。這些步驟中的每一步都有優化的潛力，對此我們在後面會一一討論。

在客戶機准備語句。對於動態 SQL，在語句執行前就要做這一步，此處的性能是很重要的；對於靜態 SQL，這一步的性能實際上關系不大，因為語句的准備是事先完成的。
在客戶機，將要插入的行的各個列值組裝起來，發送到 DB2 服務器。
DB2 服務器確定將這一行插入到哪一頁中。
DB2 在用於該頁的緩沖池中預留一個位置。如果 DB2 選定的是一個已有的頁，那麼就需要讀磁盤；如果使用一個新頁，則要在表空間（如果是SMS，也就是系統管理存儲的表空間）中為該頁物理地分配空間。插入了新行的每一頁最後都要從緩沖池寫入到磁盤。
在目標頁中對該行進行格式化，並獲得該行上的一個X（exclusive，獨占的）行鎖。
將反映該 insert 的一條記錄寫入到日志緩沖區中。
最後提交包含該 insert 的事務，如果這時日志緩沖區中的記錄還沒有被寫入日志文件的話，則將這些記錄寫到日志文件中。

此外，還可能發生很多類型的附加處理，這取決於數據庫配置，例如，索引或觸發器的存在。這種額外的處理對於性能來說也是意義重大的，我們在後面會討論到。

insert 的替代方案

在詳細討論 insert 的優化之前，讓我們先考慮一下 insert 的兩種替代方案：load 和 import。import 實用程序實際上是 SQL INSERT 的一個前端，但它的某些功能對於您來說也是有用的。load 也有一些有用的額外功能，但是我們使用 load 而不使用 insert 的主要原因是可以提高性能。

load 直接格式化數據頁，而避免了由於插入導致的對每一行進行處理的大部分開銷（例如，日志記錄在這裡實際上是消除了）。而且，load 可以更好地利用多處理器機器上的並行性。在 V8 load 中有兩個新功能，它們對於 load 成為 insert 的替代方案有著特別的功效，這兩個功能是：從游標裝載和從調用層接口（CLI）應用程序裝載。

從游標裝載

這種方法可用於應用程序的程序代碼（通過 db2Load API），或用於 DB2 腳本。下面是後一種情況的一個例子：
declare staffcursor cursor forselect * from staff; load from staffcursor of cursor insert into myschema.new_staff;
這兩行可以用下面一行替代：
insert into myschema.new_staff select * from staff
同等效的 INSERT ... SELECT 語句相比，從游標裝載幾乎可以提高 20% 的性能。

從 CLI 裝載

這種方法顯然只限於調用層接口（CLI）應用程序，但是它非常快。這種技巧非常類似於數組插入，DB2 附帶了這樣的示例，使用 load 時的速度是使用經過完全優化的數組插入時的兩倍，幾乎要比未經優化的數組插入快 10 倍。

所有 insert 可以改進的地方

讓我們看看插入處理的一些必要步驟，以及我們可以用來優化這些步驟的技巧。

1. 語句准備

作為一條 SQL 語句，INSERT 語句在執行之前必須由 DB2 進行編譯。這一步驟可以自動發生（例如在 CLP 中，或者在一次 CLI SQLExecDirect 調用中），也可以顯式地進行（例如，通過一條 SQL Prepare、CLI SQLPrepare 或 JDBC prepareStatement 語句）。該編譯過程牽涉到授權檢查、優化，以及將語句轉化為可執行格式時所需的其他一些活動。在編譯語句時，語句的訪問計劃被存儲在包緩存中。

如果重復地執行相同的 INSERT 語句，則該語句的訪問計劃（通常）會進入到包緩存中，這樣就免除了編譯的開銷。然而，如果 insert 語句對於每一行有不同的值，那麼每一條語句都將被看成是惟一的，必須單獨地進行編譯。因此，將像下面這樣的重復語句：
insert into mytable values (1, 'abc') insert into mytable values (2, 'def')
等等，
換成帶有參數標記的語句，一次准備，重復執行，這樣做是十分可取的：
insert into mytable values (?, ?)

使用參數標記可以讓一系列的 insert 的運行速度提高數倍。（在靜態 SQL 程序中使用主機變量也可以獲得類似的好處。）

2. 發送列值到服務器

可以歸為這一類的優化技巧有好幾種。最重要的一種技巧是在每條 insert 語句中包括多行，這樣就可以避免對於每一行都進行客戶機-服務器通信，同時也減少了 DB2 開銷。可用於多行插入的技巧有：

[1] [2] 下一篇