INSERT 處理過程概述
首先讓我們快速地看看插入一行時的處理步驟。這些步驟中的每一步都有優化的潛力,對此我們在後面會一一討論。
insert 的替代方案
在詳細討論 insert 的優化之前,讓我們先考慮一下 insert 的兩種替代方案:load 和 import。import 實用程序實際上是 SQL INSERT 的一個前端,但它的某些功能對於您來說也是有用的。load 也有一些有用的額外功能,但是我們使用 load 而不使用 insert 的主要原因是可以提高性能。
load 直接格式化數據頁,而避免了由於插入導致的對每一行進行處理的大部分開銷(例如,日志記錄在這裡實際上是消除了)。而且,load 可以更好地利用多處理器機器上的並行性。在 V8 load 中有兩個新功能,它們對於 load 成為 insert 的替代方案有著特別的功效,這兩個功能是:從游標裝載和從調用層接口(CLI)應用程序裝載。
從游標裝載
這種方法可用於應用程序的程序代碼(通過 db2Load API),或用於 DB2 腳本。下面是後一種情況的一個例子: declare staffcursor cursor forselect * from staff;
load from staffcursor of cursor insert into myschema.new_staff;
這兩行可以用下面一行替代: insert into myschema.new_staff select * from staff
同等效的 INSERT ... SELECT 語句相比,從游標裝載幾乎可以提高 20% 的性能。
從 CLI 裝載
這種方法顯然只限於調用層接口(CLI)應用程序,但是它非常快。這種技巧非常類似於數組插入,DB2 附帶了這樣的示例,使用 load 時的速度是使用經過完全優化的數組插入時的兩倍,幾乎要比未經優化的數組插入快 10 倍。
所有 insert 可以改進的地方
讓我們看看插入處理的一些必要步驟,以及我們可以用來優化這些步驟的技巧。
1. 語句准備
作為一條 SQL 語句,INSERT 語句在執行之前必須由 DB2 進行編譯。這一步驟可以自動發生(例如在 CLP 中,或者在一次 CLI SQLExecDirect 調用中),也可以顯式地進行(例如,通過一條 SQL Prepare、CLI SQLPrepare 或 JDBC prepareStatement 語句)。該編譯過程牽涉到授權檢查、優化,以及將語句轉化為可執行格式時所需的其他一些活動。在編譯語句時,語句的訪問計劃被存儲在包緩存中。
如果重復地執行相同的 INSERT 語句,則該語句的訪問計劃(通常)會進入到包緩存中,這樣就免除了編譯的開銷。然而,如果 insert 語句對於每一行有不同的值,那麼每一條語句都將被看成是惟一的,必須單獨地進行編譯。因此,將像下面這樣的重復語句: insert into mytable values (1, 'abc')
insert into mytable values (2, 'def')
等等,
換成帶有參數標記的語句,一次准備,重復執行,這樣做是十分可取的: insert into mytable values (?, ?)
使用參數標記可以讓一系列的 insert 的運行速度提高數倍。(在靜態 SQL 程序中使用主機變量也可以獲得類似的好處。)
2. 發送列值到服務器
可以歸為這一類的優化技巧有好幾種。最重要的一種技巧是在每條 insert 語句中包括多行,這樣就可以避免對於每一行都進行客戶機-服務器通信,同時也減少了 DB2 開銷。可用於多行插入的技巧有:
[1] [2] 下一篇