通常情況下,Limit關鍵字可以接受一個或者兩個數字參數。需要注意的是,這個參數必須是一個整數常量。如果用戶給定兩個參數,則第一個參數表示第一個返回記錄行的偏移量,第二個參數則表示返回記錄行的最大數據。另外需要提醒的是,初始記錄行的偏移量是0,而不是1。不少用戶會在這裡犯錯誤。
雖然使用了Limit語句來限制返回的記錄數,從而可以提高應用程序的工作效率。但是其也會給系統的性能帶來一些負面影響。如可能會導致全表掃描等等。為此筆者給出一些Limit關鍵字的優化的建議,以供大家參考。
建議一:靈活使用Limit 0子句
根據Limit關鍵字的定義,如果參數為0的話,則其返回的是空記錄。這看起來好像沒有多少的意義。其實不然。在實際工作中,靈活使用這個0參數,能夠給我們帶來很大的收獲。
如現在數據庫工程師想要確認一下某個查詢語句的有效性,如果直接運行這個查詢語句,需要等待其返回的記錄。如果涉及的紀錄數量比較多,或者運算邏輯比較復雜,那麼需要等到比較長的時間。此時就可以在Select查詢語句中,使用Limit 0子句。只要查詢語句沒有語法上的錯誤,這就可以讓數據庫快速的返回一個空集合。從而幫助數據庫設計人員迅速的判斷查詢語句的有效性。另外這個空集和中還會返回某個表的各個字段的數據類型。即通過這個Limit 0子句還可以查詢某個表的表結構。
可見靈活應用Limir 0子句,確實能夠給我們帶來不小的收益。不過需要注意的是,在某些特定的場合下,這個子句可能不會奏效。如通常情況下,在Monitor工作環境中不支持這個Limit 0子句。此時結果只會顯示Empty Set,而不是我們所需要的結果。
建議二:Limit與Group By結合使用
Group By關鍵字主要用來對數據進行分類匯總。不過在分類匯總之前,往往需要對數據先進性排序。而Limit語句用來指定顯示的結果數量時,往往也需要涉及到紀錄的分類匯總與排序的問題。如現在一個學校成績管理系統中,需要對學生的總分進行排序。即先對學生各科成績進行匯總,然後顯示其排名為前50的紀錄。此時就需要同時用到Group By子句和Limit子句。其實從這個案例中我們也可以看出,這兩個子句相互依賴的特性。正是因為這種特性(經常相互結合使用),為此結合Group By子句可以提高Limit的查詢效率。
這主要是因為兩者如果一起使用的話,Limit關鍵字將不會再重復計算任何不必要的Group By的值。換句話說,在某些情況下,Group By子句能夠通過順序來讀取鍵或者在鍵上做排序來解決分類匯總時的排序問題,然後再計算摘要直到關鍵字的值的改變為止。如此的話,兩個子句所需要做的一些共同性的工作,只要做一次即可。這就可以從另外一次角度用來提高應用系統的性能。相比先做一個視圖對數據進行分類匯總的運算,再使用一個查詢語句來抽取特定數量的記錄,效率就要高一點。因為後者是將兩個子句分開來使用,就無法享受到結合使用所體現的優勢。
建議三:使用SQL_calc_found_rows來提高子句的靈活性默認情況下,Limit子句返回用戶所指定的記錄行數。只要數據庫已經發送了用戶所需要的行數,則數據庫系統會放棄剩余的查詢。即上面這個學生成績的案例中,如果用戶只需要返回總分成績排名前50的學生,則數據庫只返回50條記錄,然後終止查詢作業。
但是在某些特定的情況下,用戶可能仍然需要繼續後續的查詢呢?如用戶出了查詢某些特定的記錄,還需要知道總的記錄數量,此時該如何處理?如現在用戶需要知道排名前50的學生信息,同時需要知道總分在500分以上的總人數。此時單獨使用Limit子句可能無法滿足用戶的需求,因為其只關心前面50條記錄。如果要實現這個需求的話,往往需要結合SQL_calc_found_rows關鍵字。
這個關鍵字的主要用途就是能夠在查詢時為數據庫管理員事先准備好符合Where條件語句的記錄數目。然後用戶只要在隨後執行一條Select Found_ROWS語句之後,就可以獲得符合條件的記錄總數。不過需要注意的是,使用這個關鍵字會帶來一定的副作用。即帶有這個關鍵字的查詢語句,是無法使用數據緩存的。故在某些情況下會降低數據查詢的性能。故一般情況下,這個關鍵字只用於Where條件語句比較復雜的情況。當然這只是一個出於性能考慮的建議,而並不是技術上的限制。即即使Where條件語句不復雜,也可以使用這個關鍵字,不會出現語法上的錯誤。只是其在性能上並不是很理想。
建議四:與Distinct關鍵字共同使用時的特殊現象
Distinct關鍵字主要用來過濾重復的記錄。而Limit關鍵字則主要用來指定記錄所返回的行數。如果這兩個關鍵字共同使用時,會出現什麼樣的情況呢?如果從字面意思去理解,數據庫會返回指定的不重復的記錄數。如Limit的參數為50,則數據庫返回50條不重復的記錄數。然後後續的查詢就會停止。如果查詢的記錄中有重復記錄,則數據庫查詢的實際數量往往要比Limit關鍵字所指定的數量要多。
在實際工作中,這條語句的作用還是很大的。如現在有一張員工考勤信息的表格。現在數據庫管理員需要統計缺勤次數排名前20的員工人數。此時為了防止有重復的記錄,就可以在查詢語句中加一個Distinct關鍵字,用來過濾重復的記錄數。從而可以避免采用多個查詢語句來完成這個需求。
建議五:Limit與索引之間的關系
如果數據庫管理員決定使用Limit子句來指定需要顯示的記錄數,那麼最好能夠最大限度的使用索引,以避免全表掃描,提高工作效率。即當數據庫選擇做完整的表掃描時,可以在某些情況下使用索引。
如現在數據庫管理員決定將Limit子句與Order BY子句一起使用。數據庫一旦找到了排序結果的第一個RowCount行,則系統將會結束排序,而並不會對整個表進行排序。如果單獨使用Order By子句的話,則會對整個表進行排序。雖然如此,但是排序必定要浪費一定的時間。此時數據庫管理員如果決定使用索引,則可以在很大程度上提高這個查詢的效率。
對於這個內容,筆者要強調一個問題。如果必須要進行文件排序,則必須選擇所有匹配查詢,並且在確定已經找到第一個行之前,必須對他們的大部分內容進行了排序。特別需要強調的是,在任何情況下,一旦找到了行,則就不需要再排序結果的其他部分,數據庫會自動結束排序。
可見Limit子句其本質的功能是限制用戶的紀錄數量。但是其還有很多別的用途。如快速判斷查詢語句的有效性、計算表所需要的空間等等。不過其也有一定的副作用,可能會帶系統的運行帶來一些負面的影響。此時最好能夠采取一些措施來提高系統運行的性能。