拼多多面試題：如何用 Redis 統計獨立使用者通路量？

衆所周至，拼多多的待遇也是高的可怕，在挖人方面也是不遺餘力，對于一些工作3年的開發，稍微優秀一點的，都給到30K的Offer。

當然，拼多多加班也是出名的，一周上6天班是常态，每天工作時間基本都是超過12個小時，也是相當辛苦的。

廢話不多說，今天我們來聊一聊拼多多的一道背景面試真題，是一道簡單的架構類的題目：

拼多多有數億的使用者，那麼對于某個網頁，怎麼使用Redis來統計一個網站的使用者通路數呢？

1、Hash

哈希是Redis的一種基礎資料結構，Redis底層維護的是一個開散列，會把不同的key映射到哈希表上，如果是遇到關鍵字沖突，那麼就會拉出一個連結清單出來。

當一個使用者通路的時候，如果使用者登陸過，那麼我們就使用使用者的id，如果使用者沒有登陸過，那麼我們也能夠前端頁面随機生成一個key用來辨別使用者

當使用者通路的時候，我們可以使用HSET指令，key可以選擇URI與對應的日期進行拼湊，field可以使用使用者的id或者随機辨別，value可以簡單設定為1。

當我們要統計某一個網站某一天的通路量的時候，就可以直接使用HLEN來得到最終的結果了。

優點：簡單，容易實作，查詢也是非常友善，資料準确性非常高。

缺點：占用記憶體過大，。随着key的增多，性能也會下降。小網站還行，拼多多這種數億PV的網站肯定受不了。

2、Bitset

我們知道，對于一個32位的int，如果我們隻用來記錄id，那麼隻能夠記錄一個使用者，但如果我們轉成2進制，每位用來表示一個使用者，那麼我們就能夠一口氣表示32個使用者，空間節省了32倍！

對于有大量資料的場景，如果我們使用bitset，那麼可以節省非常多的記憶體。推薦：Redis 21問，你會幾道？

對于沒有登陸的使用者，我們也可以使用雜湊演算法，把對應的使用者辨別哈希成一個數字id。bitset非常的節省記憶體，假設有1億個使用者，也隻需要100000000/8/1024/1024約等于12兆記憶體。

Redis已經為我們提供了SETBIT的方法，使用起來非常的友善，我們可以看看下面的例子。

關注微信公衆号：Java技術棧，在背景回複：redis，可以擷取我整理的 N 篇最新 Redis 教程，都是幹貨。

我們在item頁面可以不停地使用SETBIT指令，設定使用者已經通路了該頁面，也可以使用GETBIT的方法查詢某個使用者是否通路。最後我們通過BITCOUNT可以統計該網頁每天的通路數量。

優點：占用記憶體更小，查詢友善，可以指定查詢某個使用者，資料可能略有瑕疵，對于非登陸的使用者，可能不同的key映射到同一個id，否則需要維護一個非登陸使用者的映射，有額外的開銷。

缺點：如果使用者非常的稀疏，那麼占用的記憶體可能比方法一更大。

3、機率算法

對于拼多多這種多個頁面都可能非常多通路量的網站，如果所需要的數量不用那麼準确，可以使用機率算法

事實上，我們對一個網站的UV的統計，1億跟1億零30萬其實是差不多的。

在Redis中，已經封裝了HyperLogLog算法，他是一種基數評估算法。這種算法的特征，一般都是資料不存具體的值，而是存用來計算機率的一些相關資料。

當使用者通路網站的時候，我們可以使用PFADD指令，設定對應的指令，最後我們隻要通過PFCOUNT就能順利計算出最終的結果，因為這個隻是一個機率算法，是以可能存在0.81%的誤差。

優點：占用記憶體極小，對于一個key，隻需要12kb。對于拼多多這種超多使用者的特别适用。

缺點：查詢指定使用者的時候，可能會出錯，畢竟存的不是具體的資料。總數也存在一定的誤差。

上面就是常見的3種适用Redis統計網站使用者通路數的方法了。

分享一份 2019 最新 Java 架構師學習資料

作者：沙茶敏碎碎念

https://url.cn/5tQPEQg

推薦去我的部落格閱讀更多：

1.Java JVM、集合、多線程、新特性系列教程

2.Spring MVC、Spring Boot、Spring Cloud 系列教程

3.Maven、Git、Eclipse、Intellij IDEA 系列工具教程

4.Java、後端、架構、阿裡巴巴等大廠最新面試題

生活很美好，明天見～

拼多多面試題：如何用 Redis 統計獨立使用者通路量？

繼續閱讀

Java String.format方法的簡單使用

neo4j之cypher使用文檔

Dijkstra--簡易版（最短路徑）

Git學習筆記5 merge沖突時二選一

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

spark/scala關于【資源檔案】加載方法概述外部檔案加載方案測試資源檔案打包入jar包中小結

mybatis_入門程式Mybatis入門

vue-cli簡介（中文翻譯）

AOP程式設計_Android優雅權限架構(1)概念基礎，2021金三銀四前言正文大綱正文

Effective Java 8:通用程式設計

OOM三種類型

工廠模式-三種類型

【遞歸】高效率求2的n次幂

win10本地scala和spark安裝安裝scala安裝spark

scala (3) Function 和 Method

hdu7108哈希