游標是邪惡的!
在關系數據庫中,我們對於查詢的思考是面向集合的。而游標打破了這一規則,游標使得我們思考方式變為逐行進行.對於類C的開發人員來著,這樣的思考方式會更加舒服。
正常面向集合的思維方式是:
而對於游標來說:
這也是為什麼游標是邪惡的,它會使開發人員變懶,懶得去想用面向集合的查詢方式實現某些功能.
同樣的,在性能上,游標會吃更多的內存,減少可用的並發,占用寬帶,鎖定資源,當然還有更多的代碼量……
從游標對數據庫的讀取方式來說,不難看出游標為什麼占用更多的資源,打個比方:
當你從ATM取錢的時候,是一次取1000效率更高呢,還是取10次100?
既然游標這麼“邪惡”,為什麼還要學習游標
我個人認為存在既是合理.歸結來說,學習游標原因我歸納為以下2點
1.現存系統有一些游標,我們查詢必須通過游標來實現
2.作為一個備用方式,當我們窮盡了while循環,子查詢,臨時表,表變量,自建函數或其他方式扔來無法實現某些查詢的時候,使用游標實現.
T-SQL中游標的生命周期以及實現
在T-SQL中,游標的生命周期由5部分組成
1.定義一個游標
在T-SQL中,定義一個游標可以是非常簡單,也可以相對復雜,取決於游標的參數.而游標的參數設置取決於你對游標原理的了解程度.
游標其實可以理解成一個定義在特定數據集上的指針,我們可以控制這個指針遍歷數據集,或者僅僅是指向特定的行,所以游標是定義在以Select開始的數據集上的:
T-SQL中的游標定義在MSDN中如下:
DECLARE cursor_name CURSOR [ LOCAL | GLOBAL ] [ FORWARD_ONLY | SCROLL ] [ STATIC | KEYSET | DYNAMIC | FAST_FORWARD ] [ READ_ONLY | SCROLL_LOCKS | OPTIMISTIC ] [ TYPE_WARNING ] FOR select_statement [ FOR UPDATE [ OF column_name [ ,...n ] ] ][;]
看起來很讓人頭痛是吧.下面仔細講一下如何定義游標:
游標分為游標類型和游標變量,對於游標變量來說,遵循T-SQL變量的定義方法(啥,不知道T-SQL變量定義的規則?參考我前面的博文).游標變量支持兩種方式賦值,定義時賦值和先定義後賦值,定義游標變量像定義其他局部變量一樣,在游標前加”@”,注意,如果定義全局的游標,只支持定義時直接賦值,並且不能在游標名稱前面加“@”,兩種定義方式如下:
下面我們來看游標定義的參數:
LOCAL和GLOBAL二選一
LOCAL意味著游標的生存周期只在批處理或函數或存儲過程中可見,而GLOBAL意味著游標對於特定連接作為上下文,全局內有效,例如:
如果不指定游標作用域,默認作用域為GLOBAL
FORWARD_ONLY 和 SCROLL 二選一
FORWARD_ONLY意味著游標只能從數據集開始向數據集結束的方向讀取,FETCH NEXT是唯一的選項,而SCROLL支持游標在定義的數據集中向任何方向,或任何位置移動,如下圖:
STATIC KEYSET DYNAMIC 和 FAST_FORWARD 四選一
這四個關鍵字是游標所在數據集所反應的表內數據和游標讀取出的數據的關系
STATIC意味著,當游標被建立時,將會創建FOR後面的SELECT語句所包含數據集的副本存入tempdb數據庫中,任何對於底層表內數據的更改不會影響到游標的內容.
DYNAMIC是和STATIC完全相反的選項,當底層數據庫更改時,游標的內容也隨之得到反映,在下一次fetch中,數據內容會隨之改變
KEYSET可以理解為介於STATIC和DYNAMIC的折中方案。將游標所在結果集的唯一能確定每一行的主鍵存入tempdb,當結果集中任何行改變或者刪除時,@@FETCH_STATUS會為-2,KEYSET無法探測新加入的數據
FAST_FORWARD可以理解成FORWARD_ONLY的優化版本.FORWARD_ONLY執行的是靜態計劃,而FAST_FORWARD是根據情況進行選擇采用動態計劃還是靜態計劃,大多數情況下FAST_FORWARD要比FORWARD_ONLY性能略好.
READ_ONLY SCROLL_LOCKS OPTIMISTIC 三選一
READ_ONLY意味著聲明的游標只能讀取數據,游標不能做任何更新操作
SCROLL_LOCKS是另一種極端,將讀入游標的所有數據進行鎖定,防止其他程序進行更改,以確保更新的絕對成功
OPTIMISTIC是相對比較好的一個選擇,OPTIMISTIC不鎖定任何數據,當需要在游標中更新數據時,如果底層表數據更新,則游標內數據更新不成功,如果,底層表數據未更新,則游標內表數據可以更新
2.打開游標
當定義完游標後,游標需要打開後使用,只有簡單一行代碼:
OPEN test_Cursor注意,當全局游標和局部游標變量重名時,默認會打開局部變量游標
3.使用游標
游標的使用分為兩部分,一部分是操作游標在數據集內的指向,另一部分是將游標所指向的行的部分或全部內容進行操作
只有支持6種移動選項,分別為到第一行(FIRST),最後一行(LAST),下一行(NEXT),上一行(PRIOR),直接跳到某行(ABSOLUTE(n)),相對於目前跳幾行(RELATIVE(n)),例如:
對於未指定SCROLL選項的游標來說,只支持NEXT取值.
第一步操作完成後,就通過INTO關鍵字將這行的值傳入局部變量:
比如下面代碼:
游標經常會和全局變量@@FETCH_STATUS與WHILE循環來共同使用,以達到遍歷游標所在數據集的目的,例如:
4.關閉游標
在游標使用完之後,一定要記得關閉,只需要一行代碼:CLOSE+游標名稱
CLOSE test_Cursor5.釋放游標
當游標不再需要被使用後,釋放游標,只需要一行代碼:DEALLOCATE+游標名稱
DEALLOCATE test_Cursor對於游標一些優化建議
如果能不用游標,盡量不要使用游標用完用完之後一定要關閉和釋放盡量不要在大量數據上定義游標盡量不要使用游標上更新數據盡量不要使用insensitive, static和keyset這些參數定義游標如果可以,盡量使用FAST_FORWARD關鍵字定義游標如果只對數據進行讀取,當讀取時只用到FETCH NEXT選項,則最好使用FORWARD_ONLY參數總結
本文從游標的基本概念,到生命周期來談游標。游標是非常邪惡的一種存在,使用游標經常會比使用面向集合的方法慢2-3倍,當游標定義在大數據量時,這個比例還會增加。如果可能,盡量使用while,子查詢,臨時表,函數,表變量等來替代游標,記住,游標永遠只是你最後無奈之下的選擇,而不是首選。