以下的文章主要是對Mysql LIMIT簡單介紹,我們大家都知道LIMIT子句一般是用來限制SELECT語句返回的實際行數。LIMIT取1個或是2個數字參數,如果給定的是2個參數,第一個指定要返回的第一行的偏移量,第二個指定返回行的最大數目。
初始行的偏移
量是0(不是1)。
- mysql> select * from table LIMIT 6,10;
得到第7-16行
如果給定一個參數,它指出返回行的最大數目。
- mysql> select * from table LIMIT 5;
得到前5行
換句話說,LIMIT n等價於Mysql LIMIT 0,n。MYSQL的優化是非常重要的。其他最常用也最需要優化的就是limit。mysql的limit給分頁帶來了極大的方便,但數據量一大的時候,limit的性能就急劇下降。同樣是取10條數據
- select * from yanxue8_visit limit 10000,10
和
- select * from yanxue8_visit limit 0,10
就不是一個數量級別的。
網上也很多關於limit的五條優化准則,都是翻譯自mysql手冊,雖然正確但不實用。今天發現一篇文章寫了些關於limit優化的,很不錯。原文地址:http://www.zhenhua.org/article.asp?id=200下面附有原文)
文中不是直接使用limit,而是首先獲取到offset的id然後直接使用Mysql limit size來獲取數據。根據他的數據,明顯要好於直接使用limit。這裡我具體使用數據分兩種情況進行測試。測試環境win2033+p4雙核(3GHZ) +4G內存 mysql 5.0.19)
1、offset比較小的時候。
- select * from yanxue8_visit limit 10,10
多次運行,時間保持在0.0004-0.0005之間
- Select * From yanxue8_visit Where vid >=(
- Select vid From yanxue8_visit Order By vid limit 10,1
- ) limit 10
多次運行,時間保持在0.0005-0.0006之間,主要是0.0006結論:偏移offset較小的時候,直接使用limit較優。這個顯然是子查詢的原因。
2、offset大的時候
- select * from yanxue8_visit limit 10000,10
多次運行,時間保持在0.0187左右
- Select * From yanxue8_visit Where vid >=(
- Select vid From yanxue8_visit Order By vid limit 10000,1
- ) limit 10
多次運行,時間保持在0.0061左右,只有前者的1/3。可以預計offset越大,後者越優。
附上原文:
select * from table LIMIT 5,10; #返回第6-15行數據
select * from table LIMIT 5; #返回前5行
select * from table LIMIT 0,5; #返回前5行
性能優化:
基於MySQL5.0中Mysql limit的高性能,我對數據分頁也重新有了新的認識.
- Select * From cyclopedia Where ID>=(
- Select Max(ID) From (
- Select ID From cyclopedia Order By ID limit 90001
- ) As tmp
- ) limit 100;
- Select * From cyclopedia Where ID>=(
- Select Max(ID) From (
- Select ID From cyclopedia Order By ID limit 90000,1
- ) As tmp
- ) limit 100;
同樣是取90000條後100條記錄,第1句快還是第2句快?
第1句是先取了前90001條記錄,取其中最大一個ID值作為起始標識,然後利用它可以快速定位下100條記錄
第2句擇是僅僅取90000條記錄後1條,然後取ID值作起始標識定位下100條記錄
第1句執行結果.100 rows in set (0.23) sec
第2句執行結果.100 rows in set (0.19) sec
很明顯第2句勝出.看來limit好像並不完全像我之前想象的那樣做全表掃描返回limit offset+length條記錄,這樣看來limit比起MS-SQL的Top性能還是要提高不少的.
其實第2句完全可以簡化成
- Select * From cyclopedia Where ID>=(
- Select ID From cyclopedia limit 90000,1
- )limit 100;
直接利用第90000條記錄的ID,不用經過Max運算,這樣做理論上效率因該高一些,但在實際使用中幾乎看不到效果,因為本身定位ID返回的就是1條記錄,Max幾乎不用運作就能得到結果,但這樣寫更清淅明朗,省去了畫蛇那一足.
可是,既然MySQL有limit可以直接控制取出記錄的位置,為什麼不干脆用Select * From cyclopedia limit 90000,1呢?豈不更簡潔?
這樣想就錯了,試了就知道,結果是:1 row in set (8.88) sec,怎麼樣,夠嚇人的吧,讓我想起了昨天在4.1中比這還有過之的"高分".Select * 最好不要隨便用,要本著用什麼,選什麼的原則, Select的字段越多,字段數據量越大,速度就越慢. 上面2種分頁方式哪種都比單寫這1句強多了,雖然看起來好像查詢的次數更多一些,但實際上是以較小的代價換取了高效的性能,是非常值得的.
第1種方案同樣可用於MS-SQL,而且可能是最好的.因為靠主鍵ID來定位起始段總是最快的.
- Select Top 100 * From cyclopedia Where ID>=(
- Select Top 90001 Max(ID) From (
- Select ID From cyclopedia Order By ID
- ) As tmp
- )
但不管是實現方式是存貯過程還是直接代碼中,瓶頸始終在於MS-SQL的TOP總是要返回前N個記錄,這種情況在數據量不大時感受不深,但如果成百上千萬,效率肯定會低下的.相比之下MySQL的Mysql limit就有優勢的多,執行:
- Select ID From cyclopedia limit 90000
- Select ID From cyclopedia limit 90000,1
而MS-SQL只能用Select Top 90000 ID From cyclopedia 執行時間是390ms,執行同樣的操作時間也不及MySQL的360ms.