本文将从一个数据分析师的所需要的整体知识框架和能力入手,和大家分享一个优秀的数据分析师是怎样炼成的。
主要会讲数据分析师的演变、数据分析价值体系、数据分析师必备的四大能力、七大常用思路以及实战分析案例。
近些年,互联网公司对数据分析师岗位的需求越来越多,这不是偶然。
过去十多年,中国互联网行业靠着人口红利和流量红利野蛮生长;而随着流量获取成本不断提高、运营效率的不断下降,这种粗放的经营模式已经不再可行。互联网企业迫切需要通过数据分析来实现精细化运营,降低成本、提高效率;而这对数据分析师也提出了更高的要求。本文将和大家分享数据分析师的演变、数据分析价值体系、数据分析师必备的四大能力、七大常用思路以及实战分析案例。
Part 1 | 数据分析师的前世今生
在介绍数据分析师之前,我们先来看一下这几个历史人物,看看他们都跟数据分析师有着怎样的渊源?
(历史上大名鼎鼎的「分析师」)
上面展示的六个历史人物(从左往右,从上往下)分别是:张良、管仲、萧何、孙斌、鬼谷子和诸葛亮。他们是历史上大名鼎鼎的谋士,有的还做过丞相。他们博览群书、眼光独到,通过对大量史实进行总结发现了很多规律,并且在实践中成功预测了很多事件。他们通过 「历史统计——总结分析——预测未来」的实践为自己的组织创造了绝大的价值,而这就是「数据分析师」的前身。
那么现在,数据分析师需要哪些必备技能,如何成为一名优秀的数据分析师呢?
Part 2 | 数据分析师的价值金字塔
一个完整的企业数据分析体系涉及到多个环节:采集、清理、转化、存储、可视化、分析决策等等。其中,不同环节工作内容不一样,消耗的时间和产生的价值也相差甚远。
上面这幅图是「数据分析师的价值金字塔」。
互联网企业数据分析体系中至少有三方面的数据:用户行为数据、交易订单数据和CRM数据。工程师把不同来源的数据采集好,然后通过清理、转化等环节统一到数据平台上;再由专门的数据工程师从数据平台上提出数据。这些工作占用了整个环节90%的时间,然而产生的价值却只占10%。
这个金字塔再往上数据分析就和业务实际紧密结合,以报表、可视化等方式支持企业的业务决策,涵盖产品、运营、市场、销售、客户支持各个一线部门。这个部分占用了整个环节才10%的时间,但是却能产生90%的价值。
一个优秀的商务数据分析师应该以价值为导向,紧密结合产品、运营、销售、客户支持等实践,支持各条业务线发现问题、解决问题并创造更多的价值。
Part 3 | 数据分析师必备的四大能力
1. 全局观
某日,产品经理跑过来问我:Hi, 能不能帮我看一下昨天产品新功能发送的数据?谢谢!条件反射我会说:好,我马上给你!不过我还是礼貌性地问了一句:为什么需要这数据呢?产品经理回复道:哦,昨天新功能上线了,我想看看效果。知道了产品经理的目的,我就可以针对性地进行数据提取和分析,分析的结果和建议也就更加具有可操作性。
很多时候,数据分析师不能就数说数,陷入各种报表中不能自拔。一个优秀的数据分析师应该具有全局观,碰到分析需求的时候退一步多问个为什么,更好地了解问题背景和分析目标。
2. 专业度
某企业的数据科学家针对用户流失情形进行建模预测,最终得到的用户流失模型预测准确率高达90%多。准确率如此之高,让商务分析师都不敢相信。经过检验,发现数据科学家的模型中有一个自变量是 “用户是否点击取消按钮” 。而点击了“取消”按钮是用户流失的重要征兆,做过这个动作的用户基本上都会流失,用这个自变量来预测流失没有任何业务意义和可操作性。
数据分析师要在所在行业(例如电商、O2O、社交、媒体、SaaS、互金等等)展示她/他的专业度,熟悉自己行业的业务流程和数据背后的意义,避免上面的数据笑话。
3. 想象力
商业环境的变化越来越快、越来越复杂,一组商业数据的背后涉及到的影响因素是常人难以想象的。数据分析师应该在工作经验的基础上发挥想象力,大胆创新和假设。
根据硅谷公司的核心 KPI(Facebook 的 4-2-2 准则,LinkedIn 的 connection 规律),我们也想找到互联网企业驱动增长最核心的 KPI。基于我们的想象力和「无埋点」全量数据采集的优势, 我们创造了「 GrowingIO 留存魔法师」 。通过全量采集的数据,智能自动的后端计算,以及简单的使用交互,留存魔法师可以帮助企业迅速找到与其留存最相关的用户行为,就像魔法师轻轻挥动魔法棒一样简单。例如某 SaaS 产品 ,在一周内创建过 3 个图表的用户(群)留存率非常高,那么「一周+3个+图表」就是我们驱动用户增长的魔法数字。
4. 信任度
以销售岗位为例,一个销售人员首先要和用户建立起信任;如果用户不信任你的话,那他也很难信任或者购买你的产品。同理,数据分析师要和各部门同事建立良好的人际关系,形成一定的信任。各个部门的同事信任你了,他们才可能更容易接受你的分析结论和建议;否则事倍功半。
Part 4 | 数据分析常见的七种思路
1. 简单趋势
通过实时访问趋势了解产品使用情况,便于产品迅速迭代。访问用户量、访问来源、访问用户行为三大指标对于趋势分析具有重要意义。
(分钟级的实时走势分析)
(以星期为周期的趋势对比)
2. 多维分解
数据分析师可以根据分析需要,从多维度对指标进行分解。例如浏览器类型、操作系统类型、访问来源、广告来源、地区、网站/手机应用、设备品牌、APP 版本等等维度。
(多维度分析访问用户的属性)
3. 转化漏斗
按照已知的转化路径,借助漏斗模型分析总体和每一步的转化情况。常见的转化情境有注册转化分析、购买转化分析等。
(多维度分析访问用户的属性)
4. 用户分群
在精细化分析中,常常需要对有某个特定行为的用户群组进行分析和比对;数据分析师需要将多维度和多指标作为分群条件,有针对性地优化产品,提升用户体验。
(购买过产品的、资金已赎回的、过去 14 天内有强力购买意愿的用户)
5.细查路径
数据分析师可以观察用户的行为轨迹,探索用户与产品的交互过程;进而从中发现问题、激发灵感亦或验证假设。
(通过细查路径分析用户的行为规律)
6. 留存分析
留存分析是探索用户行为与回访之间的关联。一般我们讲的留存率,是指“新增用户”在一段时间内「回访网站 / app」的比例。 数据分析师通过分析不同用户群组的留存差异、使用过不同功能用户的留存差异来找到产品的增长点。
关于更详细的留存分析,可以看我这篇文章 你能找到的最深入的留存分析文章 - 留存 · 增长 · Magic Number
(留存分析发现「创建图表」的用户留存度更高)
7. A/B 测试
A/B 测试就是同时进行多个方案并行测试,但是每个方案仅有一个变量不同;然后以某种规则(例如用户体验、数据指标等)优胜略汰选择最优的方案。数据分析师需要在这个过程中选择合理的分组样本、监测数据指标、事后数据分析和不同方案评估。
Part 5 | 数据分析实战案例
某社交平台推出付费高级功能,并且以 EDM(Email Direct Marketing,电子邮件营销)的形式向目标用户推送,用户可以直接点击邮件中的链接完成注册。该渠道的注册转化率一直在 10%-20% 之间;但是 8 月下旬开始注册转化率急剧下降,甚至不到 5%。
如果你是该公司的数据分析师,你会如何分析这个问题呢?换言之,哪些因素可能造成 EDM 转化率骤降?
一个优秀的数据分析师应该具有全局观和专业度,从业务实际出发,综合各个方面的可能性。因此,EDM 注册转化率骤降的可能性罗列如下:
1. 技术原因:ETL 延迟或者故障,造成前端注册数据缺失,注册转化率急剧下降;
2. 外部因素:该时间节点是否有节假日,其他部门近期是否有向用户发送推广邮件,这些因素可能稀释用户的注意力;
3. 内部因素:邮件的文案、设计是否有改变;邮件的到达率、打开率、点击率是否正常;邮件的注册流是否顺畅。
经过逐一排查,数据分析师将原因锁定在注册流程上:产品经理在注册环节添加了绑定信用卡的内容,导致用户的注册提交意愿大幅度下降,转化率暴跌。
一个看似简单的转化率分析问题,它的背后是数据分析师各方面能力的体现。首先是技术层面,对 ETL(数据抽取-转换-载入)的理解和认识;其实是全局观,对季节性、公司等层面的业务有清晰的了解;最后是专业度,对 EDM 业务的流程、设计等了如指掌。
练就数据分析的洪荒之力并非一朝一夕之功,而是在实践中不断成长和升华。一个优秀的数据分析师应该以价值为导向,放眼全局、立足业务、与人为善,用数据来驱动增长。
本文转自d1net(转载)
相关资源:新年快乐! python实现绚烂的烟花绽放效果