了解更多2017云栖大会·成都峰会 TechInsight & Workshop.
本手册为云栖大会Workshop之《在线用户行为分析:基于流式计算的数据处理及应用》场的《实时数据分析:海量日志数据多维透视》篇所需。主要帮助现场学员熟悉并掌握阿里云数加·分析型数据库AnalyticDB的操作和使用。
必备条件:确保已经获取到实验所需的阿里云账号和密码。
通过DMS创建AnalyticDB数据表可以通过可视化建表和SQL窗口建表两种模式。
【说明】如当前云账号为train00620@aliyun-inc.com,那么选择进入表组workshop_620。
step4:右键对应的表组,选择新建表进入可视化创建表模式。 step5:配置表名、字段名称、数据类型、主键,选择对应表组、一级分区列和更新方式,如下图所示。其中表组选择自己云账号对应的表组,一级分区列选择为pv_time,分区方式中的哈希分区数为8.
在表属性中表组选择自己账号所对应的表组,表名为pv_abc(abc同为账号后三位数字),如pv_day_620。因为表名在同一个AnalyticDB数据库中应全局唯一。
step6:在新建表页面底部,点击保存按钮。step7:在提交变更弹出框中点击确定按钮,直至提示“变更执行成功”,如下图。也可以通过DDL模式创建天浏览量pv的表,pv_day_abc(同上,abc为账号后三位数字)。
step1:点击顶部菜单栏中的SQL窗口,进入DDL模式。 step2:在SQL窗口中依次复制并执行如下SQL代码。建表SQL如下:(其中需要注意自己的表名、一级分区列以及建表所属的表组tablegroup属性。)
--统计当天实时浏览量pv CREATE TABLE pv_day_620 ( pv_time varchar NOT NULL , pv_count bigint NOT NULL , primary key (pv_time) ) PARTITION BY HASH KEY(pv_time) PARTITION NUM 8 TABLEGROUP workshop_620 OPTIONS(UPDATETYPE='realtime') ; step3:右键对应的表组,选择刷新查看已经创建成功的表。由于时间关系,关于区域访问量、按照小时统计浏览量、按设备统计浏览量和统计请求来源量的建表将不在此进行动手操作,但是讲师会给大家讲解。workshop结束后,会将所有指标统计过程的代码开发给大家进行体验。
>>>点击进入《流数据处理:通过StreamSQL分析用户行为》篇
相关资源:python入门教程(PDF版)