本文介紹redis排序命令
redis支持對list,set,sorted set元素的排序
sort 排序命令格式:
sort key [BY pattern] [LIMIT start count] [GET pattern] [ASC|DESC] [ALPHA] [STORE dstkey]
1) sort key (list)
這是最簡單的情況,沒有任何選項對集合自身元素排序並返回排序結果,默認為value升序。
示例:
復制代碼 代碼如下:
127.0.0.1:6379> lpush mimvp 12
(integer) 1
127.0.0.1:6379> lpush mimvp 11
(integer) 2
127.0.0.1:6379> lpush mimvp 13
(integer) 3
127.0.0.1:6379> lpush mimvp 10
(integer) 4
127.0.0.1:6379> lrange mimvp 0 -1
1) “10”
2) “13”
3) “11”
4) “12”
127.0.0.1:6379> sort mimvp
1) “10”
2) “11”
3) “12”
4) “13”
127.0.0.1:6379> sort mimvp desc
1) “13”
2) “12”
3) “11”
4) “10”
2) [ASC|DESC] [ALPHA] (list)
sort默認的排序方式(asc)是從小到大排的,當然也可以按照逆序或者按字符順序排。
逆序可以加上desc選項,想按字母順序排可以加alpha選項,alpha可以和desc一起用。
sort 默認以分數(數值)排序,字母使用默認的sort排序,會報錯!
示例:
復制代碼 代碼如下:
127.0.0.1:6379> lpush mylist forum
(integer) 1
127.0.0.1:6379> lpush mylist proxy
(integer) 2
127.0.0.1:6379> lpush mylist blog
(integer) 3
127.0.0.1:6379> lpush mylist apptop
(integer) 4
127.0.0.1:6379> sort mylist
(error) ERR One or more scores can't be converted into double
127.0.0.1:6379> sort mylist alpha
1) “apptop”
2) “blog”
3) “forum”
4) “proxy”
127.0.0.1:6379> sort mylist alpha desc
1) “proxy”
2) “forum”
3) “blog”
4) “apptop”
127.0.0.1:6379> sort mylist desc alpha
1) “proxy”
2) “forum”
3) “blog”
4) “apptop”
3) [BY pattern] (set)
除了可以按集合元素自身值(數字,字母)排序外,還可以將集合元素內容按照給定pattern組合成新的key,並按照新key中對應的內容進行排序。
示例:
復制代碼 代碼如下:
127.0.0.1:6379> set mimvp_12 mimvp_12
OK
127.0.0.1:6379> set mimvp_11 mimvp_11
OK
127.0.0.1:6379> set mimvp_13 mimvp_13
OK
127.0.0.1:6379> set mimvp_10 mimvp_10
OK
127.0.0.1:6379> sort mimvp by mimvp_* // mimvp_* 是字符串,因此需要alpha
(error) ERR One or more scores can't be converted into double
127.0.0.1:6379> sort mimvp by mimvp_* alpha
1) “10”
2) “11”
3) “12”
4) “13”
127.0.0.1:6379> sort mimvp by mimvp_* alpha desc
1) “13”
2) “12”
3) “11”
4) “10”
*代表了上面示例1) mimvp已經給出的元素值,所以這個排序是按照mimvp_12, mimvp_11,mimvp_13,mimvp_10這四個key對應值排序的,但返回的仍然是排序後mimvp集合中的元素,即數值13,11,12,10,而不是mimvp_*的字符串元素。
4) [GET pattern]
上面的例子都是返回的mimvp集合中的數值元素,也可以通過get選項去獲取指定pattern作為新key(mimvp_*)對應的字符串值。
示例:
復制代碼 代碼如下:
127.0.0.1:6379> sort mimvp by mimvp_* get mimvp_* alpha
1) “mimvp_10″
2) “mimvp_11″
3) “mimvp_12″
4) “mimvp_13″
127.0.0.1:6379> sort mimvp by mimvp_* get mimvp_* alpha desc
1) “mimvp_13″
2) “mimvp_12″
3) “mimvp_11″
4) “mimvp_10″
這次返回的就不在是mimvp中的元素,而是mimvp_12, mimvp_11,mimvp_13,mimvp_10對應的值,當然排序是按照mimvp_12, mimvp_11,mimvp_13,mimvp_10值並根據字母順序排的。
另外,get選項可以有多個,#特殊符號引用的是原始集合也就是mimvp(類似與sorted-set withscores)
示例:
復制代碼 代碼如下:
127.0.0.1:6379> sort mimvp by mimvp_* get mimvp_* get # alpha
1) “mimvp_10″
2) “10”
3) “mimvp_11″
4) “11”
5) “mimvp_12″
6) “12”
7) “mimvp_13″
8) “13”
127.0.0.1:6379> sort mimvp by mimvp_* get mimvp_* get # alpha desc
1) “mimvp_13″
2) “13”
3) “mimvp_12″
4) “12”
5) “mimvp_11″
6) “11”
7) “mimvp_10″
8) “10”
最後在還有一個引用hash類型字段的特殊字符 -> (hash)
示例:
復制代碼 代碼如下:
127.0.0.1:6379> hset user_12 name yanggang
(integer) 1
127.0.0.1:6379> hset user_11 name yangjie
(integer) 1
127.0.0.1:6379> hset user_13 name yangliang
(integer) 1
127.0.0.1:6379> hset user_10 name yangchuang
(integer) 1
127.0.0.1:6379> sort mimvp get user_*->name
1) “yangchuang”
2) “yangjie”
3) “yanggang”
4) “yangliang”
127.0.0.1:6379> sort mimvp get user_*->name desc
1) “yangliang”
2) “yanggang”
3) “yangjie”
4) “yangchuang”
很容易理解,如果mimvp當對應的數值不存在,則對應返回的是nil
5) [LIMIT start count] (limit)
上面例子返回結果都是全部元素,limit選項可以限定返回結果的數量。
示例:
復制代碼 代碼如下:
127.0.0.1:6379> sort mimvp get mimvp_* limit 1 2
1) “mimvp_11″
2) “mimvp_12″
127.0.0.1:6379> sort mimvp get mimvp_* limit 0 3
1) “mimvp_10″
2) “mimvp_11″
3) “mimvp_12″
start下標是從 0 開始,這裡的limit選項(limit 1 2)意思是從第二個元素開始獲取2個。
6) [STORE dstkey] (store)
如果對集合經常按照固定的模式去排序,那麼把排序結果緩存起來會減少不少cpu開銷,使用store選項可以將排序內容保存到指定key中,保存的類型是list
復制代碼 代碼如下:
127.0.0.1:6379> sort mimvp get mimvp_* limit 0 3 store mimvp_store
(integer) 3
127.0.0.1:6379> type mimvp_store
list
127.0.0.1:6379> lrange mimvp_store 0 -1
1) “mimvp_10″
2) “mimvp_11″
3) “mimvp_12″
這個例子將排序結果保存到mimvp_store中,後面使用直接從mimvp_store提取即可。
小結
功能介紹完後,再討論下關於排序的一些問題。
如果有多個redis server的話,不同的key可能存在於不同的server上。比如mimvp_12, mimvp_11,mimvp_13,mimvp_10,很有可能分別在四個不同的server上存貯著,這種情況會對排序性能造成很大的影響。
redis作者在他的blog上提到了這個問題的解決辦法,就是通過key tag將需要排序的key都放到同一個server上 。由於具體決定哪個key存在哪個服務器上一般都是在client端hash的辦法來做的,我們可以通過只對key的部分進行hash
舉個例子:
假如我們 的client如果發現key中包含[],那麼只對key中[]包含的內容進行hash,我們將四個name相關的key,都這樣命名[name]12 [name]13 [name]11 [name]10,於是client 程序就會把他們都放到同一server上(不知道jredis實現了沒)。
還有一個問題也比較嚴重
如果要sort的集合非常大的話排序就會消耗很長時間。由於redis單線程的,所以長時間的排序操作會阻塞其他client的 請求。解決辦法是通過主從復制機制將數據復制到多個slave上。然後我們只在slave上做排序操作,並盡可能的對排序結果緩存。另外就是一個方案是就是采用sorted set對需要按某個順序訪問的集合建立索引。
示例:
復制代碼 代碼如下:
127.0.0.1:6379> sadd tom:friend:list 123 # tom的好友列表裡面是好友的uid
(integer) 1
127.0.0.1:6379> sadd tom:friend:list 456
(integer) 1
127.0.0.1:6379> sadd tom:friend:list 789
(integer) 1
127.0.0.1:6379> sadd tom:friend:list 101
(integer) 1
127.0.0.1:6379> set uid:sort:123 1000 # uid對應的成績
OK
127.0.0.1:6379> set uid:sort:456 6000
OK
127.0.0.1:6379> set uid:sort:789 100
OK
127.0.0.1:6379> set uid:sort:101 5999
OK
127.0.0.1:6379> set uid:123 “{‘uid':123,'name':'lucy'}” # 增加uid對應好友信息
OK
127.0.0.1:6379> set uid:456 “{‘uid':456,'name':'jack'}”
OK
127.0.0.1:6379> set uid:789 “{‘uid':789,'name':'marry'}”
OK
127.0.0.1:6379> set uid:101 “{‘uid':101,'name':'icej'}”
OK
127.0.0.1:6379> sort tom:friend:list by uid:sort:* get uid:* # 從好友列表中獲得id與uid:sort字段匹配後排序,並根據排序後的順序,用key在uid表獲得信息
1) “{‘uid':789,'name':'marry'}”
2) “{‘uid':123,'name':'lucy'}”
3) “{‘uid':101,'name':'icej'}”
4) “{‘uid':456,'name':'jack'}”
127.0.0.1:6379> sort tom:friend:list by uid:sort:* get uid:* get uid:sort:*
1) “{‘uid':789,'name':'marry'}”
2) “100”
3) “{‘uid':123,'name':'lucy'}”
4) “1000”
5) “{‘uid':101,'name':'icej'}”
6) “5999”
7) “{‘uid':456,'name':'jack'}”
8) “6000”
問題與分析
1. sort mimvp by mimvp_* get mimvp_* get # alpha 為什麼會按照 10 – 13 的順序排下來,這個跟單純的排序name*和name * alpha的結果都不一樣
這個問題要從redis的實現邏輯上來分析了
a) list在插入後,默認是按照時間的先後反序排列的(先進後出,FILO) , lrange ml 0 -1,結果是:12 13 11 10. 這是因為list插入時是將最新的item插入到鏈表頭
b) sort mimvp by mimvp_* 確定是會按照mimvp_*的值進行排序的.但當mimvp_*對應的value不是num型並且沒有設置alpha的時候,會導致排序分值都是相同的,因為程序將把mimvp_*對應的值嘗試轉換為nun型
c) 這就會導致sort mimvp by mimvp_*會按照ml的自然順序進行排列了
復制代碼 代碼如下:
if (alpha) {
if (sortby) {
vector[j].u.cmpobj = getDecodedObject(byval);
}
}
else {
if (byval->encoding == REDIS_ENCODING_RAW) {
vector[j].u.score = strtod(byval->ptr,NULL);
}
else if (byval->encoding == REDIS_ENCODING_INT) {
/* Don't need to decode the object if it's
* integer-encoded (the only encoding supported) so
* far. We can just cast it
*/
vector[j].u.score = (long)byval->ptr;
}
else {
redisAssert(1 != 1);
}
}