本节书摘来异步社区《redis入门指南(第2版)》一书中的第3章,第3.6节,作者: 李子骅 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。
了解了集合类型后,小白终于被redis的强大功能所折服了,但他却不愿止步于此。这不,小白又想给博客加上按照文章访问量排序的功能:
老师您好,之前您已经介绍过了如何使用列表类型键存储文章id列表,不过我还想加上按照文章访问量排序的功能,因为我觉得很多访客更希望看那些热门的文章。
宋老师回答到:
这个功能很好实现,不过要用到一个新的数据类型,也是我要介绍的最后一个数据类型—有序集合。
有序集合类型(sorted set)的特点从它的名字中就可以猜到,它与上一节介绍的集合类型的区别就是“有序”二字。
在集合类型的基础上有序集合类型为集合中的每个元素都关联了一个分数,这使得我们不仅可以完成插入、删除和判断元素是否存在等集合类型支持的操作,还能够获得分数最高(或最低)的前n个元素、获得指定分数范围内的元素等与分数有关的操作。虽然集合中每个元素都是不同的,但是它们的分数却可以相同。
有序集合类型在某些方面和列表类型有些相似。
(1)二者都是有序的。
(2)二者都可以获得某一范围的元素。
但是二者有着很大的区别,这使得它们的应用场景也是不同的。
(1)列表类型是通过链表实现的,获取靠近两端的数据速度极快,而当元素增多后,访问中间数据的速度会较慢,所以它更加适合实现如“新鲜事”或“日志”这样很少访问中间元素的应用。
(2)有序集合类型是使用散列表和跳跃表(skip list)实现的,所以即使读取位于中间部分的数据速度也很快(时间复杂度是o(log(n)))。
(3)列表中不能简单地调整某个元素的位置,但是有序集合可以(通过更改这个元素的分数)。
(4)有序集合要比列表类型更耗费内存。
有序集合类型算得上是redis的5种数据类型中最高级的类型了,在学习时可以与列表类型和集合类型对照理解。
1.增加元素
zadd命令用来向有序集合中加入一个元素和该元素的分数,如果该元素已经存在则会用新的分数替换原有的分数。zadd命令的返回值是新加入到集合中的元素个数(不包含之前已经存在的元素)。
假设我们用有序集合模拟计分板,现在要记录tom、peter和david三名运动员的分数(分别是89分、67分和100分):
这时我们发现peter的分数录入有误,实际的分数应该是76分,可以用zadd命令修改peter的分数:
分数不仅可以是整数,还支持双精度浮点数:
其中+inf和-inf分别表示正无穷和负无穷。
2.获得元素的分数
示例如下:
3.获得排名在某个范围的元素列表
zrange命令会按照元素分数从小到大的顺序返回索引从start到stop之间的所有元素(包含两端的元素)。zrange命令与lrange命令十分相似,如索引都是从0开始,负数代表从后向前查找(−1表示最后一个元素)。就像这样:
如果需要同时获得元素的分数的话可以在zrange命令的尾部加上withscores参数,这时返回的数据格式就从“元素1, 元素2, …, 元素n”变为了“元素1, 分数1, 元素2, 分数2, …, 元素n, 分数n”,例如:
zrange命令的时间复杂度为o(log n+m)(其中n为有序集合的基数,m为返回的元素个数)。
如果两个元素的分数相同,redis会按照字典顺序(即"0" < "9" < "a" < "z" < "a" < "z"这样的顺序)来进行排列。再进一步,如果元素的值是中文怎么处理呢?答案是取决于中文的编码方式,如使用utf-8编码:
可见此时redis依然按照字典顺序排列这些元素。
zrevrange命令和zrange的唯一不同在于zrevrange命令是按照元素分数从大到小的顺序给出结果的。
4.获得指定分数范围的元素
zrangebyscore命令参数虽然多,但是都很好理解。该命令按照元素分数从小到大的顺序返回分数在min和max之间(包含min和max)的元素:
如果希望分数范围不包含端点值,可以在分数前加上“(”符号。例如,希望返回”80分到100分的数据,可以含80分,但不包含100分,则稍微修改一下上面的命令即可:
min和max还支持无穷大,同zadd命令一样,-inf和+inf分别表示负无穷和正无穷。比如你希望得到所有分数高于80分(不包含80分)的人的名单,但你却不知道最高分是多少(虽然有些背离现实,但是为了叙述方便,这里假设可以获得的分数是无上限的),这时就可以用上+inf了:
withscores参数的用法与zrange命令一样,不再赘述。
了解sql语句的读者对limit offset count应该很熟悉,在本命令中limit offset count 与 sql 中的用法基本相同,即在获得的元素列表的基础上向后偏移offset个元素,并且只获取前count个元素。为了便于演示,我们先向scoreboard键中再增加些元素:
现在scoreboard键中的所有元素为:
想获得分数高于60分的从第二个人开始的3个人:
那么,如果想获取分数低于或等于 100 分的前 3 个人怎么办呢?这时可以借助zrevrangebyscore命令实现。对照前文提到的zrange命令和zrevrange命令之间的关系,相信读者很容易能明白 zrevrangebyscore 命令的功能。需要注意的是zrevrangebyscore 命令不仅是按照元素分数从大往小的顺序给出结果的,而且它的min和max参数的顺序和zrangebyscore命令是相反的。就像这样:
5.增加某个元素的分数
zincrby 命令可以增加一个元素的分数,返回值是更改后的分数。例如,想给jerry加4分:
如果指定的元素不存在,redis 在执行命令前会先建立它并将它的分数赋为 0 再执行操作。
1.实现按点击量排序
要按照文章的点击量排序,就必须再额外使用一个有序集合类型的键来实现。在这个键中以文章的 id 作为元素,以该文章的点击量作为该元素的分数。将该键命名为posts:page.view,每次用户访问一篇文章时,博客程序就通过zincrby posts:page. view 1文章id更新访问量。
需要按照点击量的顺序显示文章列表时,有序集合的用法与列表的用法大同小异:
另外3.2节介绍过使用字符串类型键post:文章id:page.view来记录单个文章的访问量,现在这个键已经不需要了,想要获得某篇文章的访问量可以通过zscore posts:page. view文章id来实现。
2.改进按时间排序
3.4节介绍了每次发布新文章时都将文章的id加入到名为posts:list的列表类型键中来获得按照时间顺序排列的文章列表,但是由于列表类型更改元素的顺序比较麻烦,而如今不少博客系统都支持更改文章的发布时间,为了让小白的博客同样支持该功能,我们需要一个新的方案来实现按照时间顺序排列文章的功能。
为了能够自由地更改文章发布时间,可以采用有序集合类型代替列表类型。自然地,元素仍然是文章的id,而此时元素的分数则是文章发布的unix时间14。通过修改元素对应的分数就可以达到更改时间的目的。
14 unix时间指utc时间1970年1月1日0时0分0秒起至现在的总秒数(不包括闰秒)。为什么是1970年呢?因为unix在1970年左右诞生。
另外借助zrevrangebyscore命令还可以轻松获得指定时间范围的文章列表,借助这个功能可以实现类似wordpress的按月份查看文章的功能。
1.获得集合中元素的数量
zcard key
例如:
2.获得指定分数范围内的元素个数
zcount命令的min和max参数的特性与zrangebyscore命令中的一样:
3.删除一个或多个元素
zrem命令的返回值是成功删除的元素数量(不包含本来就不存在的元素)。
4.按照排名范围删除元素
zremrangebyrank命令按照元素分数从小到大的顺序(即索引0表示最小的值)删除处在指定排名范围内的所有元素,并返回删除的元素数量。如:
5.按照分数范围删除元素
zremrangebyscore命令会删除指定分数范围内的所有元素,参数min和max的特性和zrangebyscore命令中的一样。返回值是删除的元素数量。如:
zrank命令会按照元素分数从小到大的顺序获得指定的元素的排名(从0开始,即分数最小的元素排名为0)。如:
zrevrank命令则相反(分数最大的元素排名为0):
7.计算有序集合的交集
zinterstore命令用来计算多个有序集合的交集并将结果存储在destination键中(同样以有序集合类型存储),返回值为destination键中的元素个数。
destination键中元素的分数是由aggregate参数决定的。
(1)当aggregate是sum时(也就是默认值),destination键中元素的分数是每个参与计算的集合中该元素分数的和。例如:
(2)当aggregate是min时,destination键中元素的分数是每个参与计算的集合中该元素分数的最小值。例如:
(3)当aggregate是max时,destination键中元素的分数是每个参与计算的集合中该元素分数的最大值。例如:
zinterstore命令还能够通过weights参数设置每个集合的权重,每个集合在参与计算时元素的分数会被乘上该集合的权重。例如:
另外还有一个命令与zinterstore命令的用法一样,名为zunionstore,它的作用是计算集合间的并集,这里不再赘述。