一、隨機查詢一條數據
方法一:SELECT * FROM `table` ORDER BY RAND() limit 1
評價:不建議使用,效率非常低,官方文檔中進行說明:Order By和RAND()連用,會多次掃描表,導致速度變慢。
方法二:SELECT * FROM `table`
WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM `table`)))
ORDER BY id LIMIT 1;
解釋:SELECT MAX(id) FROM `table` 這句話查詢出最大的id值
SELECT floor(RAND() * (SELECT MAX(id) FROM `table`)) 這句獲取一個小於MAX(id)的隨機數
WHERE id >= (SELECT floor(RAND() * (SELECT MAX(id) FROM `table`))) 這句話篩選出所有的大於生成隨機數的id的行
然後最後就把大於這個隨機id的行查詢出來,然後按照id排序,選擇第一個,就相當與獲取了所有行中隨機的一行。
評價:有問題,如果id不是從0開始的話,比如從10000開始自增,那麼 SELECT floor(RAND() * (SELECT MAX(id) FROM `table`)) 得到的將是會喲很大概率得到小於10000的值,經過where限定的查詢結果將會是所有的查詢結果的幾率變大,最後limit 1獲取的是第一行數據的幾率變高。
方法三:SELECT * FROM `table`
WHERE id >= (SELECT floor( RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`)) + (SELECTMIN(id) FROM `table`))) ORDER BY id LIMIT 1;
方法四:SELECT *
FROM `table` AS t1 JOIN (SELECT ROUND(RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`))+
(SELECT MIN(id) FROM `table`)) AS id) AS t2
WHERE t1.id >= t2.id
ORDER BY t1.id LIMIT 1;
評價:解決了方法二中MAX(id)的問題,RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`)) + (SELECTMIN(id) FROM `table`)可以獲取MAX(id)和MIN(id)中的隨機數。
方法四要比方法三稍快一點,http://www.jb51.net/article/42229.htm 這篇文章指出,15w條數據前者花費時間 0.147433 秒,後者花費時間 0.015130 秒。
以上解決方案都默認有一個不重復的數字字段,其實現在很多表的設計都是以一個自增段作為主鍵,當然還有一些是以uuid作為主鍵的,而沒有數字鍵,這樣的話,可以用mysql的函數將uuid的字符串轉換成數字。而且還有一個問題,如果id字段的數字分布不均勻的話(比如按照1,4,5,6,7,8,45這樣分布),也會造成隨機查詢的不合理,但是這裡就不討論那麼復雜的問題了。
二、隨機查詢多條數據
方法一:把隨機查詢一條數據的limit 1修改成limit 5
評價:這樣獲取的數據會是連續的。
方法二:
SELECT *
FROM `table` AS t1 JOIN (
SELECT ROUND(RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`))+(SELECT MIN(id) FROM `table`)) AS id
from `table` limit 50) AS t2 on t1.id=t2.id
ORDER BY t1.id LIMIT 1;
解釋:
SELECT ROUND(RAND() * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`))+(SELECT MIN(id) FROM `table`)) AS id
from `table` limit 50)這樣會獲取50個隨機數字,然後on t1.id=t2.id會挑選出不大於50行的隨機數據,然後取5條就好了。