写在前面
- 数据分析的关键字:趋势、对比、多维度细分;
数据分析思路:是什么、为什么、怎么办。不要本末倒置,一想到数据分析就去学工具,Python和R,你的核心在于你的产品思维,Excel完全够用了。其实贯穿其中的还是产品的基础能力,找到你的产品的关键路径,在路径积累的数据中发现问题。发掘出用户的喜好、购买/使用及流失的内在原因。
- 多看数据,让数据变成你的一部分,可以脱口而出。经验都是慢慢积累起来的。
- 数据分析要辅以用户CE,对用户了解得更透彻。可以直接找到用户,问他们为什么继续使用/放弃使用。举一个QQ邮箱的例子,在初期,团队有一个硬性指标:“1 000/100/10”法则:每个产品经理每个月要去论坛看1 000个用户体验反馈并回复,关注100个用户博客,做10个用户调查。
一、数据分析的意义
- 数据可以客观反映出一款产品当前的状态好坏和所处阶段。
- 数据可以告诉你,你的问题出在哪里。
- 假如你想要实现某个目标,数据可以帮助你找到达成的最佳路径。
- 精细的数据分析可以帮助你通过层层拆分,对于用户更了解,也对整个站内的生态更有掌控力。
二、数据分析的分类
1.描述型数据分析
大多数数据分析停留在这个层面,这也是我们常常在后台见到的数据表现形式。
定义:描述型分析是用来概括、表述事物整体状况以及事物间关联、类属关系的统计方法,例如新增用户数、DAU、PV、UV、人群分类、收入等。
2.诊断型数据分析
定义:细分到特定的时间维度和空间维度,依据数据的浅层表现和自身的历史累积经验来判断现象/问题出现的原因。
最常见的如漏斗模型,层层剖析数据是否有异动,进而判断问题出现的环节及其原因。
3.预测型数据分析
定义:包括利用预测模型,机器学习,数据挖掘等技术来分析当前和历史的数据,从而对未来或其他不确定的事件进行预测。
4.规范型数据分析
定义:规范型分析通过 “已经发生什么”、“为什么发生”和“什么将发生”,也就是综合运用上述提及的描述型分析、诊断型分析和预测型分析,对潜在用户进行商品/服务推荐和决策支持。
这其实需要更加复杂的工具和算法才能实现,对于产品来说,我们需要做的是什么呢?我们需要做的其实是提出业务目标,并拆分目标,提出关键指标,预测可能出现的关键问题,并在模型运行出来后不断寻找badcase,让这个模型不断的校正达到良好的分析和预测效果。
三、数据分析指标和工具
指标:
- 拉新阶段:关注用户来源的类型:纯新用户(第一次注册)还是老用户(再注册);广告的用户来源有多少,弹窗广告的用户来源有多少等等。
- 转化阶段:关注转化率:200个用户浏览了你的宣传页面,注册的有100人,这100人就是实现了转化,转化率为50%
- 活跃阶段:关注用户在产品内的活跃量,不同的产品表现形式不同。例如,贴吧:发帖量、回帖量等等;视频网站:点击量,观看量等;电商网站关注付费率、客单价、CTR等等。
- 留存阶段:关注留存或流失的用户量。产品某天新增用户1000个,第二天仍旧活跃的用户有350个,那么称次日留存率有35%,如果第七天仍旧活跃的用户有100个,那么称七日留存率为10%。
工具:
这篇讲的很详细
http://www.pmcaff.com/article/index/550503014868096?from=profile
三、我自己分析的例子
百度结果页分析
- 背景:百度结果页针对移动端做了很多优化,包括智能聚合/知识图谱等,不同于传统的结果页样式,卡片式更符合移动端使用习惯。此次数据分析的目的是统计分析出他们的规律,为自己的搜索结果提供借鉴。
- 过程:
- 首先爬取了一周的百度结果页数据,发现其中每一条结果都有类型标识符tpl,类型直接与结果的聚合展现形式相关;
- 将结果按照曝光PV排序,以此得出出现频率最高的结果,发现普通类型的结果占了80%,说明普通网页曝光量还是最大的;
- 对排序前几的结果进行曝光率的排序,发现智能结果覆盖的头部领域占95%,也就是说我们优先对头部领域结果进行聚合可以覆盖95%的需求。
- 梳理头部领域分为哪些,各自的规律是什么。
- 关键指标:曝光PV、曝光率、结果覆盖率。
后台订单失败原因分析
这个其实并不算传统数据分析,这算非结构化数据分析中的文本分析
- 背景:我负责后台系统,各业务之间流程复杂,需要比较严谨的逻辑 ,也就是传统意义上比较枯燥的工作吧。但是这里面有一点比较好的是可以看到大量的用户工单(约等于用户反馈)。因为每天看到大量的用户反馈,所以对于问题出现的比例比较熟悉,当有哪一类问题出现的突增时,能够比较敏感的发现。
- 过程:
- 发现问题:有一段时间,订单支付的工单比例突增,问题集中在支付了之后,没有相应资源充到账户下,在后台的记录中可以看到资源是分配成功了的,所以可以初步判断是可用性问题,一定是在订单支付过程中有哪里阻碍了用户操作或者操作反馈不足。
- 维度细分:我们又对对应的订单进行了支付渠道的细分,发现在这部分订单中,采用微信支付的订单比例远远高出支付宝支付,由此可以判断出微信支付过程中存在可用性问题。
- 定位问题:对于微信支付订单的方式进行了多次测试,果然发现了问题所在,原来支付宝支付之后会有5秒钟的倒数弹框,此时有充足的时间分配资源,并显示在账户中;微信支付成功时间比较快,没有倒数弹框,后台没有充足的时间分配资源,从支付页面返回后页面又不会定时刷新,所以会出现资源不出现的情况
- 解决问题:在微信支付后加3秒倒数弹框。
数据来源及参考资料: