天天看點

Redis指令—— HyperLogLog

Redis 在 2.8.9 版本添加了 HyperLogLog 結構。

Redis HyperLogLog 是用來做基數統計的算法,HyperLogLog 的優點是,在輸入元素的數量或者體積非常非常大時,計算基數所需的空間總是固定 的、并且是很小的。

在 Redis 裡面,每個 HyperLogLog 鍵隻需要花費 12 KB 記憶體,就可以計算接近 2^64 個不同元素的基 數。這和計算基數時,元素越多耗費記憶體就越多的集合形成鮮明對比。

但是,因為 HyperLogLog 隻會根據輸入元素來計算基數,而不會儲存輸入元素本身,是以 HyperLogLog 不能像集合那樣,傳回輸入的各個元素。

什麼是基數?

比如資料集 {1, 3, 5, 7, 5, 7, 8}, 那麼這個資料集的基數集為 {1, 3, 5 ,7, 8}, 基數(不重複元素)個數為5。 基數估計就是在誤差可接受的範圍内,快速計算基數個數。

執行個體

以下執行個體示範了 HyperLogLog 的工作過程:

redis 127.0.0.1:6379> PFADD mykey "redis"
1) (integer) 1

redis 127.0.0.1:6379> PFADD mykey "mongodb"
1) (integer) 1

redis 127.0.0.1:6379> PFADD mykey "mysql"
1) (integer) 1

redis 127.0.0.1:6379> PFCOUNT mykey 
(integer) 3           

Redis HyperLogLog 指令

下表列出了 redis HyperLogLog 的基本指令:

序号 指令及描述
1 PFADD key element [element ...] 添加指定元素到 HyperLogLog 中。
2 PFCOUNT key [key ...] 傳回給定 HyperLogLog 的基數估算值。
3 PFMERGE destkey sourcekey [sourcekey ...] 将多個 HyperLogLog 合并為一個 HyperLogLog

參考:

https://redis.io/commands http://www.runoob.com/redis/redis-hyperloglog.html http://www.redis.net.cn/tutorial/3513.html https://www.yiibai.com/redis/redis_hyperloglog.html

繼續閱讀