引言
最近本人打算入门数据分析,也看了一些书。本文是对最近看的一些书籍观点的提炼并结合个人在实习时候的思考。非常浅显,估计也应该有些错误,请多包涵。
今天谈的是数据分析的基本流程,即包括:“确认— 分解 — 评估 — 决策 ”四个基本步骤。
一、确认与分解
确认的含义是:确认问题,明白数据分析的目的是什么?作为一个现在都还没入门数据分析的新手,我一开始拿到自己在实习的时候某一次H5活动的数据统计表格是懵逼,几千行的数据(PV、UV、传播量、二次传播等等),根本就无从下手。这时候上司又要求你通过数据分析一下这次活动的效果如何?这时候该怎么办呢?
因此,我们需要明确的第一点是“带着目的去看数据”。这也是本书中,告诉我们第一件事情。
那么我们怎么去明确我们的目的呢?
书中谈到有两个方法:
第一,挖掘数据需求方(老板、上司...)的信息,这样做的原因是,第一,数据需求方不仅可能知道更多消息、数据。第二,这会让你最后分析的结果更加符合被报告方的需求。
比如:他也许会反馈给你说:
- H5活动页面在游戏内部的入口上会不会有问题?
- 往期的活动数据效果是如何...
那么我们就可以提炼出“入口的深度”、“对比往期的数据”这两个关键点。
第二,根据自己的经验判断、比如参考过往的其他案例的研究思路,比如研究H5的数据分析,我就会去看一些主流数据机构出具的报告,研究下对方是从哪一些角度进行分析的。
但总而言之,无论什么方法,最终的目的都是要回归“能够带着清晰的目的去分析数据”这个点上。(而不是简单地认为我要分析下传播量)。
那么通过上司的反馈并结合自己的经验和后,你就有了一个大概的分析方向。
接下来就是第二个步骤,分解。
我对书中的分解理解为两个部分:
第一部分:分解问题。 即:在明确数据分析目的后,把问题进行拆分为小的模块。
譬如:我们的目的是提高游戏中H5活动页面的传播量。这是一个非常宽泛的问题。我们可以把它拆分为:
- 从获取用户的角度分析:我们如何获取用户?单个用户的成本如何?
- 从提高H5活动参与活跃度角度分析:活动排行榜的数据如何?玩家在活动中平均获得的奖励数量如何?
- 从H5活动的留存率角度分析:用户会不会只是打开看一眼、参与一下就关掉页面?PV或者UV会不会在短时间内就大幅减少?
- 从H5活动的最终转换率角度分析?点击“下载游戏”&“FAB页面”的数量是多少?
二、分解数据
分解数据即:在把问题分解后,根据拆分的问题,把数据表拆成不同的小模块,并对关键因子进行比较。譬如:
分析一个H5被点击的方式,是从朋友圈进入比较多还是从好友/群进入比较多。那么需比较的关键因子就是“朋友圈进入数”和“好友/群进入数”。
当然这里的例子是比较简单的。
总之,核心便是:明确分析的目的后对数据进行分解。而不是把是PV、UV、导入量乱加一通。
二、评估与决策
评估与决策的定义是:对数据收集、整理等过程后,做出新的预估与判断。
比如在一个H5中,分享率不低(玩家把H5分享至朋友圈、好友),但是二次传播量(被分享链接的打开数量)却不高,说明:该H5页面的标题可能不那么吸引人,无法吸引其他用户去打开。
那么,我们做出的决策便是:可以在第二波宣传的时候,对标题和缩略图重新进行修改。
三、结语
在书中,提供了一个很基本的分析报告模板:
第一部分,背景:说明做这个数据分析的原因是什么?有哪一些背景资料?也是上面提到的四个流程中的,确认环节。
第二部分,数据解说:我们根据得到的数据,比较关键因子,得出一些基础性的结论。也是上面提到的数据分解环节。
第三部分,建议:做完数据分析后,得出接下来该做出什么新的决策,去提高我们的销量、活跃度、留存率等等。
本来是四个步骤,我只是归纳为两个大步骤。
当然,这是数据分析最基础的入门性知识,具体实施起来并没有这么容易,比如我们会遇到:
得到的原始数据的格式是混乱不堪的,连简单的汇总都很困难。
多个数据之间的定义是交叉的
数据之间是有一些混杂因素
在一些数据分析领域,我们需要做 A/B 测试去验证
...
总而言之,任重而道远。
本文参考:
《深入浅出数据分析》— Michael Milton
《游戏数据分析的艺术》— 于洋 / 余敏雄 / 吴娜 / 师胜柱
网上其他零碎的文章