Redis（十）：Redis特殊类型之Hyperloglog基数统计

2023-07-30 22:54:41

redis 2.8.9版本就更新了Hyperloglog数据结构！

Hyperloglog：基数统计算法！0.81%的错误率，不过统计大量数据可以忽略！

在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。

但是，因为 HyperLogLog 只会根据输入元素来计算基数，而不会储存输入元素本身，所以 HyperLogLog 不能像集合那样，返回输入的各个元素。

1、什么是基数

比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数。

A{1，3，6，7，5，6}

B{1，3，5，7，6}

两个的基数都（不重复的元素）=5，可以接受误差！

2、Hyperloglog简介

Redis Hyperloglog 基数统计的算法！

比如在CSDN中一位用户访问多次，但是统计中依旧算作一个人

传统的方式是用set集合把每个人的id保存下来，然后统计元素数量，但是太费内存了，而目标是统计数量，如果还要浪费大量的空间，就很不划算！

优点：占用的内存是固定的，统计2^64这么大的基数，只占用12kb的内存，就很方便！

3、常用命令

127.0.0.1:6379> PFADD thekey1 a b c d e f g h i j k l m	//创建第一组元素
(integer) 1
127.0.0.1:6379> PFADD thekey2 n o p q r s t u v w x y z //创建第二组元素
(integer) 1
127.0.0.1:6379> PFCOUNT thekey1	//查询数量
(integer) 13
127.0.0.1:6379> PFCOUNT thekey2
(integer) 13
127.0.0.1:6379> PFMERGE thekey3 thekey1 thekey2 //合并两组
OK
127.0.0.1:6379> PFCOUNT thekey3
(integer) 25		//百分之零点八的误差出现了？

允许容错的话，可以使用Hyperloglog

Redis（十）：Redis特殊类型之Hyperloglog基数统计

1、什么是基数

2、Hyperloglog简介

3、常用命令

继续阅读

秒懂JVM的三大参数类型，就靠这十个小实验了初级—中级—高级三个级别的大厂面试真题阿里云——Java 实习生/初级美团——Java 中级蚂蚁金服——Java 高级基础篇JVM 篇MySQL 篇Redis 篇

CentOs7 安装redis4.0 遇到的坑一、CentOs7连接网络二、make文件的时候出错三、安装ruby的redis插件时候报错最后

docker 搭建Redis 问题解决

如何解决Redis缓存击穿、雪崩、穿透问题

java 版本的redis-stat不能运行在后台和daemon

redis管理常用命令

django短信验证码的后端实现

Redis订阅了一段时间后订阅失效了（ redisTemplate.convertAndSend）

2022秋招面试总结（cpp+java+测开）百度测开一面字节后端一面虾皮后端一面虾皮后端二面

数据迁移方法数据迁移原则数据迁移之双写方案数据迁移之级联同步方案

微服务-性能压测\缓存redis和分布式锁redisson和SpringCache

Nacos 2.0 升级前后性能对比压测

Spring数据和Redis

redis集群数据一致性_RedisRaft为Redis集群带来强大的数据一致性

supervisor 管理redis 和httpd 环境centos7

Redis简介一(单机版)发展历程Redis