1.Hyperloglog是什么,原理?
HyperLogLog 提供不精确的去重计数方案,标准误差大概在 0.81%,满足上面的用户访问量的统计需求了。
对于HyperLogLog一个Key只需要12kb
原理:
基数就是指一个集合中不同值的数目,比如[a,b,c,d]的基数就是4,[a,b,c,d,a]的基数还是4,因为a重复了一个,不算。
2.优缺点?
优点:占用内存极小,对于一个key,只需要12kb。对于拼多多这种超多用户的特别适用。
缺点:查询指定用户的时候,可能会出错,毕竟存的不是具体的数据。总数也存在一定的误差。
3学习相关