天天看點

《大資料系統建構:可擴充實時資料系統建構原理與最佳實踐》一1.9 示例應用:SuperWebAnalytics.com

在本書中,我們将建立一個大資料應用程式示例來說明一些概念。我們将為google analytics建構資料管理層—比如服務。該服務将能夠每天追蹤數十億的頁面浏覽量。

該服務将支援多種不同的名額。每個名額都被實時地支援。名額的範圍很廣—從簡單的統計名額,到訪客是如何浏覽網站的複雜分析名額。

示例應用将支援的名額如下:

按照時間切片基于url的頁面浏覽計數—示例查詢是“過去一年中每一天的頁面浏覽量是多少?”和“過去12小時内有多少頁面浏覽量?”

按照時間切片基于url的獨立訪客—示例查詢是“2010年有多少獨立訪客通路這個域名?”和“過去三天内每個小時,有多少訪客通路這個域名?”

跳出率分析—“使用者通路該站點的某個頁面,沒有通路其他任何頁面的百分比是多少?”

我們将建構存儲、處理并為應用程式提供查詢的層。

繼續閱讀