天天看點

大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇

本手冊為雲栖大會workshop之《線上使用者行為分析:基于流式計算的資料處理及應用》場的《實時資料分析:海量日志資料多元透視》篇所需。主要幫助現場學員熟悉并掌握阿裡雲數加·分析型資料庫analyticdb的操作和使用。

<a href="https://www.aliyun.com/product/ads" target="_blank">分析型資料庫analyticdb</a>

必備條件:確定已經擷取到實驗所需的阿裡雲賬号和密碼。

通過dms建立analyticdb資料表可以通過可視化建表和sql視窗建表兩種模式。

step2:選擇進入區域華北2,繼而點選操作欄中的進入,進入workshop_demo資料庫。

大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇

step3:根據自己擷取的阿裡雲賬号後三位數字選擇進入對應表組。

【說明】如目前雲賬号為[email protected],那麼選擇進入表組workshop_620。

step4:右鍵對應的表組,選擇建立表進入可視化建立表模式。

大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇

step5:配置表名、字段名稱、資料類型、主鍵,選擇對應表組、一級分區列和更新方式,如下圖所示。

其中表組選擇自己雲賬号對應的表組,一級分區列選擇為pv_time,分區方式中的哈希分區數為8. 在表屬性中表組選擇自己賬号所對應的表組,表名為pv_abc(abc同為賬号後三位數字),如pv_day_620。因為表名在同一個analyticdb資料庫中應全局唯一。
大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇

step6:在建立表頁面底部,點選儲存按鈕。

step7:在送出變更彈出框中點選确定按鈕,直至提示“變更執行成功”,如下圖。

大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇
大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇
也可以通過ddl模式建立天浏覽量pv的表,pv_day_abc(同上,abc為賬号後三位數字)。

step1:點選頂部菜單欄中的sql視窗,進入ddl模式。

大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇

step2:在sql視窗中依次複制并執行如下sql代碼。

大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇
建表sql如下:(其中需要注意自己的表名、一級分區列以及建表所屬的表組tablegroup屬性。)

step3:右鍵對應的表組,選擇重新整理檢視已經建立成功的表。

大資料workshop:《線上使用者行為分析:基于流式計算的資料處理及應用》之《實時資料分析:海量日志資料多元透視》篇
由于時間關系,關于區域通路量、按照小時統計浏覽量、按裝置統計浏覽量和統計請求來源量的建表将不在此進行動手操作,但是講師會給大家講解。workshop結束後,會将所有名額統計過程的代碼開發給大家進行體驗。