1.Hyperloglog是什麼,原理?
HyperLogLog 提供不精确的去重計數方案,标準誤差大概在 0.81%,滿足上面的使用者通路量的統計需求了。
對于HyperLogLog一個Key隻需要12kb
原理:
基數就是指一個集合中不同值的數目,比如[a,b,c,d]的基數就是4,[a,b,c,d,a]的基數還是4,因為a重複了一個,不算。
2.優缺點?
優點:占用記憶體極小,對于一個key,隻需要12kb。對于拼多多這種超多使用者的特别适用。
缺點:查詢指定使用者的時候,可能會出錯,畢竟存的不是具體的資料。總數也存在一定的誤差。
3學習相關