天天看点

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇

本手册为云栖大会workshop之《在线用户行为分析:基于流式计算的数据处理及应用》场的《实时数据分析:海量日志数据多维透视》篇所需。主要帮助现场学员熟悉并掌握阿里云数加·分析型数据库analyticdb的操作和使用。

<a href="https://www.aliyun.com/product/ads" target="_blank">分析型数据库analyticdb</a>

必备条件:确保已经获取到实验所需的阿里云账号和密码。

通过dms创建analyticdb数据表可以通过可视化建表和sql窗口建表两种模式。

step2:选择进入区域华北2,继而点击操作栏中的进入,进入workshop_demo数据库。

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇

step3:根据自己获取的阿里云账号后三位数字选择进入对应表组。

【说明】如当前云账号为[email protected],那么选择进入表组workshop_620。

step4:右键对应的表组,选择新建表进入可视化创建表模式。

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇

step5:配置表名、字段名称、数据类型、主键,选择对应表组、一级分区列和更新方式,如下图所示。

其中表组选择自己云账号对应的表组,一级分区列选择为pv_time,分区方式中的哈希分区数为8. 在表属性中表组选择自己账号所对应的表组,表名为pv_abc(abc同为账号后三位数字),如pv_day_620。因为表名在同一个analyticdb数据库中应全局唯一。
大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇

step6:在新建表页面底部,点击保存按钮。

step7:在提交变更弹出框中点击确定按钮,直至提示“变更执行成功”,如下图。

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇
大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇
也可以通过ddl模式创建天浏览量pv的表,pv_day_abc(同上,abc为账号后三位数字)。

step1:点击顶部菜单栏中的sql窗口,进入ddl模式。

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇

step2:在sql窗口中依次复制并执行如下sql代码。

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇
建表sql如下:(其中需要注意自己的表名、一级分区列以及建表所属的表组tablegroup属性。)

step3:右键对应的表组,选择刷新查看已经创建成功的表。

大数据workshop:《在线用户行为分析:基于流式计算的数据处理及应用》之《实时数据分析:海量日志数据多维透视》篇
由于时间关系,关于区域访问量、按照小时统计浏览量、按设备统计浏览量和统计请求来源量的建表将不在此进行动手操作,但是讲师会给大家讲解。workshop结束后,会将所有指标统计过程的代码开发给大家进行体验。