天天看點

Redis入門(4) - 排序

  • SORT指令
  • LIMIT參數
  • BY參數
  • GET參數
  • STORE參數
  • 排序性能優化

很多場合需要對元素進行排序,這時除了使用有序集合外,還可以借助Redis提供的SORT指令來排序。

SORT指令可以對清單類型、集合類型和有序集合類型的鍵進行排序。

SORT key
 SORT key DESC
 SORT key ALPHA
           

SORT指令會根據元素自身的值進行排序,在對有序集合類型排序時會忽略元素的分數。

預設按從小到大的順序排列,增加DESC參數可以按照倒序排列。

如果元素為非數字,增加ALPHA參數可以按照字典順序排列。如果直接對非數字元素排序會報錯:

(error)ERR One or more scores can't be converted into double
           

如果沒有加ALPHA參數的話,SORT指令會嘗試将所有元素轉換成雙精度浮點數來比較,如果無法轉換則會提示錯誤。

如果傳回結果數量較多需要分頁,可以使用LIMIT參數

SORT key DESC LIMIT offset count
           

表示在排序結果中,跳過前offset個元素,擷取之後的count個元素。

很多情況下清單(或集合、有序集合)中存儲的元素值代表的是對象的ID,單純對這些ID自身排序有時意義并不大。更多的時候會希望根據ID對應的對象的某個屬性進行排序。

這種情況下可以使用BY參數:

SORT key BY reference
           

其中reference表示排序的參考鍵,會根據參考鍵的值來排序,而不再是清單或集合中元素自身的值。

比如:

SORT tag:ruby:posts BY post:* -> time DESC
           

這裡tag:ruby:posts存儲了文章的ID,post:*為散列類型,其中的time字段為文章的釋出時間,這樣就可以将文章ID根據釋出時間排序了。執行的時候,對每個元素使用元素的值替換參考鍵中的第一個“*”并擷取其值,然後依據該值對元素排序。

上面是基于散列類型排序的寫法,基于字元串排序更簡單:

SORT sortbylist BY itemscore:* DESC
           

BY參數排序有下面幾種特殊情況:

  • 當參考鍵名不包含“*”時(即常量鍵名,與元素值無關),SORT指令将不會執行排序操作,因為Redis認為這種情況是沒有意義的(所有要比較的值都一樣)。
  • 如果幾個元素的參考鍵值相同,則SORT指令會再比較元素本身的值來決定元素的順序。
  • 當某個元素的參考鍵不存在時,會預設參考鍵的值為0。

SORT指令預設傳回的是鍵本身的元素被排序後的結果,而使用GET參數可以指定傳回鍵值。

比如前面按照文章釋出時間排序後,并不僅僅獲得文章ID,而是更進一步擷取文章的标題,可以這樣寫:

SORT tag:ruby:posts BY post:* -> time DESC GET post:*->title
           

而且,在一個SORT指令中可以使用多個GET參數(BY參數隻能有一個):

SORT tag:ruby:posts BY post:* -> time DESC GET post:*-> title GET post:* -> time
           

如果仍然需要文章的ID,可以使用GET #:

SORT tag:ruby:posts BY post:* -> time DESC GET post:*-> title GET post:* -> time GET #
           

這樣最終的結果就包含了文章的标題、釋出時間和ID。

預設情況下SORT會直接傳回排序結果,如果希望儲存排序結果,可以使用STORE參數,比如要把排序的結果儲存到sort.result鍵中:

SORT tag:ruby:posts BY post:* -> time DESC STORE sort.result
           

儲存後的鍵的類型為清單類型,如果鍵已經存在則會覆寫它。加上STORE參數後SORT指令的傳回值為結果的個數。

實際使用中,常常将STORE指令與之前學過的EXPIRE結合,來緩存排序的結果。

SORT是Redis中最強大最複雜的指令之一,但如果使用不好也很容易成為性能的瓶頸。

SORT指令的時間複雜度是O(n+mLog m),其中:

  • n表示要排序的清單(集合或有序集合)中的元素個數
  • m表示要傳回的元素個數

    當n較大的時候SORT指令的性能相對較低,并且Redis在排序前會建立一個長度為n的容器來存儲待排序的元素,雖然是一個臨時的過程,但如果同時進行較多的大資料量排序操作則會嚴重影響性能。

是以在使用SORT指令時要注意這幾點:

  • 減小n,盡量減少待排序鍵中元素的數量;
  • 減少m,使用LIMIT參數隻擷取需要的資料;
  • 如果排序的資料量較大,經常需要排序,可以使用STORE和EXPIRE将結果緩存起來。

繼續閱讀