做一名优秀的数据分析师的数据分析师并不是一个简单的旅程,从一个新手到高阶的数据分析师要经过一个漫长的过程,掌握必要的工具、方法,并在实际工作中积累经验。《数据分析之道》书中提到,掌握数据分析工具的使用是最基本的要求,数据思维是数据分析最重要的部分,数据分析工作的核心指导思想。本文对数据分析师需要掌握的基本工具和思维方法进行了一个总结,指导自己今后的数据分析工作。
数据分析技能图谱
工欲善其事,必先利其器。一名合格的数据分析师应该具备一下技能。
以下是数据分析师技能进阶图谱。Excel、统计学和数据基础、Python/R语言、SQL、Tableau、Power BI等是工具,此外也需要了解也因为分析模型和具体业务场景,黑客增长理论、精益数据分析模型可以说是理论或思维方法。工具、业务场景和思维方法整合起来,形成体系才有价值。数据分析的工具和方法,只有在深入理解业务场景的前提下才能灵活选择合适的。此外,背景不同的数据分析师掌握各个技能的顺序也会有所不同,技术型数据分析师要有比较好的编程功底,在进阶之路上要多了解业务知识;业务型数据分析师可能对企业的运营流程比较熟悉,那么就要重点学习编程知识。
深入业务寻找价值
数据本身没有价值,其价值存在于数据的应用场景中。从业务场景出发,找到对运营有指导作用的内容,这是做数据分析的基本原则。有经验的数据分析师能够深入了解业务需求、根据业务需求做数据分析,从实际出发,有的放矢。如何针对不同的业务场景进行分析,从而创造价值有一些成熟的方法论指导实践。
驱动运营增长的AARRR模型
在实践中,数据分析应该深入契合业务场景的每一个角落,在各个支撑点发力,对业务做出支撑。AARRR(海盗指标)能够给出答案。
海盗指标这一术语是由风险投资人戴夫·麦克卢尔创造。他将诸多关键数据指标归并到创业、创新和运营过程中的五大阶段,分别为获取用户(Acquisition)、提高活跃度(Acivation)、提高留存率(Retention)、赚取收益(Revenue)及形成良性传播(Referral),即AARRR。
上述五个阶段没有严格的顺序,各个阶段之间也没有明显的界限。例如,获客和留存是相辅相成的,在这两个阶段中也常常采用相同的数据分析方法。AARRR模型帮助数据分析人员思考如何用数据构建数据驱动增长的框架。
以下是各个阶段的一些关键数据指标
阶段 | 任务 | 关键数据指标 |
---|---|---|
获取用户 | 通过各种手段提高产品曝光率,从而提高产品知名度 | 流量、提及量、搜索结果排名、用户获取成本、点击率等。 |
提高活跃度 | 将获取的访客转化为真正的用户 | 注册人数、注册量、新手教程完成量、至少用过一次产品的人数、订阅量等。 |
提高留存率 | 让用户反复使用产品并表现出粘性行为 | 用户参与度、用户活跃度、流失率和留存率 |
获取收益 | 商业活动的收益(购买量、广告点击量、内容产生量等) | 用户终身价值、转化率、购物车大小、广告点击收益等。 |
通过这些可量化的关键数据指标,数据分析师可以在每一个阶段对运营的具体效果给出客观的反馈,从而驱动下一步的决策。
精益数据分析的业务方法论
有了AARRR模型以及各阶段的关键数据指标之后,还要找到一个实证有效的方法论,以指导业务的数据分析流程。阿利斯泰尔·克罗尔提出的精益数据分析,它能够让数据分析师在面对业务时不在困惑。
第一步:结合当前业务模式和业务阶段,先择一个希望改进的关键绩效指标,并为其确定一个基准。
第二步:确定数据指标,将其进行细化,找出提升绩效指标的方法。
第三步:为数据指标制定方案并进行增长实验,搜集数据进行分析,评估。
第四步:根据数据的测试和分析结果做出决策。
上述步骤第一个关键点是明确自己的业务模式和阶段,也就是确定问题。因为问题本身决定了我们需要关注的数据指标和绩效指标。
第二个强调的关键点是在数据分析的实现过程中需要制定方案,进行试验,检测方案是否达到预期效果。也就是说每推出一个新功能,做出每一个决策是否符合用户预期都需要通过方案实验搜集的数据分析结果来回答。
数据的采集与治理
数据采集之前先确定目标,目标决定数据的来源和采集方法。数据获取的方式有很多,可以通过用户调研获取数据,也可以通过软件工具抓取所需要的数据,购买第三方数据也是一种方法。对于互联网企业主流的方法是通过数据埋点来获得。
数据埋点数据分析师需要立足于当前的数据需求发,提炼出数据指标方案,并构思这些指标需要哪些数据,也就是这些数据需要埋点,形成一个初步的数据埋点方案,并进一步确定时间触发的机制和上报机制,统一数据统计口径和字段。完成这些步骤后再和业务方和前后端工程师反复讨论修改完善埋点方案。前后端工程师完成数据埋点后,数据分析师需要通过测试环境的数据验证数据埋点是否存在问题,若有问题就及时修改。
加强数据治理,提高数据质量。数据治理原则约束输入,规范结构,单一来源,规范输出
约束输入:对于多值同义的情况要限定输入,系统设计师通过下拉菜单等约束用户只能在规范值域中选择数据。只有选项很难满足需求,才让用户手动输入。手动输入要做好格式和逻辑的检查。
规范结构: 在设计表单和数据表时尽量原子化,数据表中的字段要合乎逻辑,主键的选择要精简合理。数据保持口径一致,规范一致。
单一来源:一个字段出现在多个表中,应该将表进行相互关联,使用外键约束,减少数据冲突。企业内部也应该进行数据指标规范化,创建一个通用数据字典,统一各个指标的意义和计算方法。
数据清洗与可视化
数据清洗是提高数据质量、使数据变得可用的过程,数据分析会提升数据分析的准确率。
数据分析主要处理一下4种数据。1.缺失数据;2. 重复的数据;3错误的数据;4.不可用的数据。数据清洗Excel和Python的Pandas都有相应工具或API。
数据可视化也有很多工具可以实现,比如Excel中的图表、数据透视图;专业的数据分析工具如Tableau、Power BI等,它们提供了强大的可视化功能;各种商用数据平台如Google Analytics、百度统计、西瓜数据、神策数据等,都可以实现数据的可视化。
数据分析的核心方法
用户画像:多维拆解用户信息
用户画像的本质是用户信息的标签化,它把每一个用户都描述成各类数据的变量集合。这个变量被运营和数据分析师使用,他们将其进行多维度拆解。
用户画像的形成依赖数据标签。用户的数据标签通过对用户的社会属性、消费习惯、偏好特征等多个维度的数据进行采集和处理,实现对用户或产品属性特征的刻画,并对这些特征进行分析、统计、挖掘潜在价值,从而抽象出用户的信息全貌。通过对用户的多维度了解,可以对用户进行精细化的分组,给产品开发、运营过程提供精准指导。
RFM分析:确定用户核心价值
RFM(Recency|Frequency|Monetary)分析其实是用户画像的衍生品。它通过用户最近一次消费、消费频率及消费金额3个指标将用户划分为不同的类别或集群,以描述用户的价值。
1.R代表最近一次消费,是计算最近一次消费时间点和当前时间点的时间差。因此,这里需要用到多维数据透视分析中的基本透视规则—最小值MIN求出最小的时间差。
2.F代表消费频次,是在指定区间内统计用户的购买次数。因此,这里需要用到多维数据透视分析中的基本透视规则—技术类COUNT(技术类不去重指标)统计用户的购买次数。
3.M代表消费金额,是指在指定区间内统计用户的消费总金额,因此,这里需要用到求和类指标,也即基本透视规则中的合计规则—SUM。
因为用户本身行为并不能直接用于数据分析,但是将用户行为转化为R、F、M三个指标后,我们就能对用户有更直观的认识,并将这些指标运用与数据分析、精准投放广告、制作产品推荐等多个运营场景。
波士顿矩阵:协助企业分配资源
波士顿矩阵又称四象限分析法、产品结构管理法等,常用于协助企业分析业务和产品序列的表现,从而更加妥善的分配资源、开发和使用资源。
波士顿矩阵对于企业产品所处的四个象限具有不同的定义和相应的战略对策。
(1)明星产品(stars)。它是指处于高增长率、高市场占有率象限内的产品群,这类产品可能成为企业的现金流产品,需要加大投资以支持其迅速发展。
采用的发展战略:积极扩大经济规模和市场机会,以长远利益为目标,提高市场占有率,加强竞争地位。发展战略以及明星产品的管理与组织最好采用事业部形式,由对生产技术和销售两方面都很内行的经营者负责。
(2)金牛产品(cash cow),又称厚利产品。它是指处于低增长率、高市场占有率象限内的产品群,已进入成熟期。其财务特点是销售量大,产品利润率高、负债比率低,可以为企业提供资金,而且由于增长率低,也无需增大投资。因而成为企业回收资金,支持其它产品,尤其明星产品投资的后盾。
采用的发展战略:①把设备投资和其它投资尽量压缩;②采用榨油式方法,争取在短时间内获取更多利润,为其它产品提供资金。
(3)问题产品(question marks),它是处于高增长率、低市场占有率象限内的产品群。前者说明市场机会大,前景好,而后者则说明在市场营销上存在问题。其财务特点是利润率较低,所需资金不足,负债比率高。例如在产品生命周期中处于引进期、因种种原因未能开拓市场局面的新产品即属此类问题的产品。
采用的发展战略:对问题产品应采取选择性投资战略。因此,对问题产品的改进与扶持方案一般均列入企业,长期计划中。对问题产品的管理组织,最好是采取智囊团或项目组织等形式,选拔有规划能力,敢于冒风险、有才干的人负责。
(4)瘦狗产品(dogs),也称衰退类产品。它是处在低增长率、低市场占有率象限内的产品群。其财务特点是利润率低、处于保本或亏损状态,负债比率高,无法为企业带来收益。
采用的发展战略:对这类产品应采用撤退战略:首先应减少批量,逐渐撤退,对那些销售增长率和市场占有率均极低的产品应立即淘汰。其次是将剩余资源向其它产品转移。第三是整顿产品系列,最好将瘦狗产品与其它事业部合并,统一管理。
波士顿矩阵为产品或服务强与弱的判断提供了一副有用的“地图”,能够确定每种产品或服务的价值。他提供了一个优秀的二位拆分思路,利用这个思路,不仅可以进行产品分析,还可以将其他数据维度和用户标签两两合并进行数据可视化,从而找出潜力的业务。
SWOT分析:扬长补短,实现目标
一个与波士顿矩阵非常类似的数据分析工具,以四象限的可视化方式评估公司经营状况或者产品所面临的挑战。
5W2H分析:多角度提问,发散思维
5W2H是一种多角度提问问题的方法。
(1)WHAT——是什么,目的是什么,做什么工作。
(2)WHY——为什么要做,可不可以不做,有没有替代方案。
(3)WHO——谁,由谁来做。
(4)WHEN——何时,什么时间做,什么时机最适宜。
(5)WHERE——何处,在哪里做。
(6)HOW ——怎么做,如何提高效率,如何实施,方法是什么。
(7)HOW MUCH——多少,做到什么程度,数量如何,质量水平如何,费用产出如何。
漏斗分析:显示关键转化节点
漏斗分析反应用户在使用产品和服务过程中,从起点到终点各阶段的转化率情况。这一分析方法简单易懂,在用户行为分析、APP及网站流量监控、产品转化等日常数据运营与数据分析过程中应用很广。
分析电商的转化,我们要做的就是监控每个层级上的用户转化,寻找每个层级的可优化点。对于没有按照流程操作的用户,专门绘制他们的转化模型,缩短路径提升用户体验。
A/B测试:对比不同方案
A/B测试是一种实验方法,将两个或多个版本的某个变量进行比较,以确定哪个版本对于所测试的目标最有效。在A/B测试中,将随机分配的用户组分为两个(或更多)组,每个组被展示不同版本的一个变量,例如网站的标题,颜色,布局,价格等。通过对每个组的行为和反馈进行分析,可以确定哪个版本的变量对于实现目标(例如增加销售,提高转化率等)最有效。
在不同的场景,A/B测试的侧重点也有不同,但最核心目标仍然都是围绕业务的增长展开,也就是大家所熟悉的「北极星指标」,或者是 DAU、MAU等在A/B测试中设定的具体目标。
以Camera360为案例,它选用Testin A/B测试服务帮助其进行产品优化决策。、
该案例是其产品商业化过程中的一个尝试,希望提升商店中表情包或道具的付费比例,但要完成付费指标,首先要提升商店入口点击率。
所以,他们设定了多个商店入口方案(更改图标样式、文案),通过A/B测试来验证哪个方案可以最大化提升商店入口点击率。
在验证过程中,他们也针对人群目标做了相关定向测试,如日本、中国、韩国等区域,最终他们针对这一入口同时上线7~8个测试版本,通过A/B测试,将整体点击率提升了80%左右。