在本書中,我們将建立一個大資料應用程式示例來說明一些概念。我們将為google analytics建構資料管理層—比如服務。該服務将能夠每天追蹤數十億的頁面浏覽量。
該服務将支援多種不同的名額。每個名額都被實時地支援。名額的範圍很廣—從簡單的統計名額,到訪客是如何浏覽網站的複雜分析名額。
示例應用将支援的名額如下:
按照時間切片基于url的頁面浏覽計數—示例查詢是“過去一年中每一天的頁面浏覽量是多少?”和“過去12小時内有多少頁面浏覽量?”
按照時間切片基于url的獨立訪客—示例查詢是“2010年有多少獨立訪客通路這個域名?”和“過去三天内每個小時,有多少訪客通路這個域名?”
跳出率分析—“使用者通路該站點的某個頁面,沒有通路其他任何頁面的百分比是多少?”
我們将建構存儲、處理并為應用程式提供查詢的層。