以前我在mysql中分頁都是用的 limit 100000,20這樣的方式,我相信你也是吧,但是要提高效率,讓分頁的代碼效率更高一些,更快一些,那我們又該怎麼做呢?
第一部分:看一下分頁的基本原理:
復制代碼 代碼如下:
mysql explain SELECT * FROM message ORDER BY id DESC LIMIT 10000, 20
***************** 1. row **************
id: 1
select_type: SIMPLE
table: message
type: index
possible_keys: NULL
key: PRIMARY
key_len: 4
ref: NULL
rows: 10020
Extra:
1 row in set (0.00 sec)
對上面的mysql語句說明:limit 10000,20的意思掃描滿足條件的10020行,扔掉前面的10000行,返回最後的20行,問題就在這裡,如果是limit 100000,100,需要掃描100100行,在一個高並發的應用裡,每次查詢需要掃描超過10W行,性能肯定大打折扣。文中還提到limit n性能是沒問題的,因為只掃描n行。
第二部分:根據雅虎的幾位工程師帶來了一篇Efficient Pagination Using MySQL的報告內容擴展:在文中提到一種clue的做法,給翻頁提供一些線索,比如還是SELECT * FROM message ORDER BY id DESC,按id降序分頁,每頁20條,當前是第10頁,當前頁條目id最大的是1020,最小的是1000,如果我們只提供上一頁、下一頁這樣的跳轉(不提供到第N頁的跳轉),那麼在處理上一頁的時候SQL語句可以是:
復制代碼 代碼如下:
SELECT * FROM message WHERE id>1020 ORDER BY id ASC LIMIT 20;//下一頁
處理下一頁的時候SQL語句可以是:
復制代碼 代碼如下:
SELECT * FROM message WHERE id<1000 ORDER BY id DESC LIMIT 20;//上一頁
不管翻多少頁,每次查詢只掃描20行。
缺點是只能提供上一頁、下一頁的鏈接形式,但是我們的產品經理非常喜歡“上一頁 1 2 3 4 5 6 7 8 9 下一頁”這樣的鏈接方式,怎麼辦呢?
如果LIMIT m,n不可避免的話,要優化效率,只有盡可能的讓m小一下,我們擴展前面的clue做法,還是SELECT * FROM message ORDER BY id DESC,按id降序分頁,每頁20條,當前是第10頁,當前頁條目id最大的是2519,最小的是2500;
當是第10頁的SQL如下:
復制代碼 代碼如下:
SELECT * FROM tb_goods_info WHERE auto_id >=2500 ORDER BY auto_id ASC LIMIT 0,20
比如要跳到第9頁,SQL語句可以這樣寫:
復制代碼 代碼如下:
SELECT * FROM tb_goods_info WHERE auto_id <2500 ORDER BY auto_id desc LIMIT 0,20
比如要跳到第8頁,SQL語句可以這樣寫:
復制代碼 代碼如下:
SELECT * FROM tb_goods_info WHERE auto_id <2500 ORDER BY auto_id desc LIMIT 20,20
比如要跳到第7頁,SQL語句可以這樣寫:
復制代碼 代碼如下:
SELECT * FROM tb_goods_info WHERE auto_id <2500 ORDER BY auto_id desc LIMIT 40,20
跳轉到第11頁:
復制代碼 代碼如下:
SELECT * FROM tb_goods_info WHERE auto_id >2519 ORDER BY auto_id asc LIMIT 0,20
跳轉到第12頁:
復制代碼 代碼如下:
SELECT * FROM tb_goods_info WHERE auto_id >2519 ORDER BY auto_id asc LIMIT 20,20
跳轉到第13頁:
復制代碼 代碼如下:
SELECT * FROM tb_goods_info WHERE auto_id >2519 ORDER BY auto_id asc LIMIT 40,20
原理還是一樣,記錄住當前頁id的最大值和最小值,計算跳轉頁面和當前頁相對偏移,由於頁面相近,這個偏移量不會很大,這樣的話m值相對較小,大大減少掃描的行數。其實傳統的limit m,n,相對的偏移一直是第一頁,這樣的話越翻到後面,效率越差,而上面給出的方法就沒有這樣的問題。
注意SQL語句裡面的ASC和DESC,如果是ASC取出來的結果,顯示的時候記得倒置一下。
已在60W數據總量的表中測試,效果非常明顯