来源: 猴子_数据分析学院 | 相对通识,比较基础
第一部分: 方法
1. 数据的分类有: 用户数据(包括姓名/性别/邮箱/年龄/家庭住址/教育水平/职业),行为数据(比如停留时间,浏览过的商品),产品数据(比如名称类别评论等等)
2. 常用的数据指标有哪些:
用户数据 —— 新增用户(日新增用户数),活跃用户(活跃率-需要明确活跃的定义,是登陆,还是点击还是购买),留存用户(留存率);
行为数据——PV/UV/转发率/K因子(K-factor = 平均每个用户向多少用户发出邀请X接受到的用户转化为新用户的比例)等等;
产品数据 —— 比如成交总额,客单价,付费和复购率等业务总量指标 e.g. 电商行业的GMV,游戏行业的人均ARPU(average revenue per user), 例:18年淘宝的人均消费为8732元,京东4426元,拼多多673元;
其他推广付费指标 e.g. CPC/CPM/CPA || CPC为按照点击次数收费,一般为搜索广告;CPM为按照展示次数付, 一般为展示位广告;CPD(按照App下载数付费), CPI (按照App激活数付费), CPS(按照购买的用户数或者销售额付费), 一般在信息流广告中常见,以投放实际效果看
3. 如何选择指标
我们会谈论北极星指标,是一个产品最为重要的指标。比如喜马拉雅最关心的指标就是一个用户进来他能听多久的音频。
4. 如何搭建指标体系和报表
明确部门KPI,找到一级指标 --> 了解业务运营情况,找到二级指标 --> 梳理业务流程,找到三级指标 --> 通过报表监控指标,不断更新指标体系
5. 常用的分析方法
- 逻辑树分析方法(将复杂的问题变得简单) 把问题看做树木的树干,通过不同的分枝,把问题拆解为一个个的子问题。通过解决单独的子问题,从而汇总得出问题的答案; 经常会有类似的费米问题: 比如深圳有多少产品经理,一个公交车能装下多少乒乓球?
“例子: 问题 - 中国有多少钢琴调音师? 谁 — 调音师,调音师一般是调节钢琴,那可以变成钢琴的数量 X 每个钢琴每年调多少次音 X 调一次需要多久 / 一位调音师每年工作的时间 —> 钢琴一般出现的场景在哪里? 钢琴乐器店,自己购买钢琴的家庭,演出场所,学校教育机构;+ 每个钢琴估计一年1次 + 一年工作50个星期按照一周5天每天8小时 每个调音师每年工作2000小时 —> 计算出结果
- PEST分析方法(通常用于行业分析)
政治: 政府的法律投资税收政策等等 // 社会: 一个地区的人口年龄收入分布购物习惯等等// 技术环境: 包括一些外部创新技术//
- 对比分析
和谁比: 和自己比 + 和行业比; 比较数据整体的大小(平均数中位数),数据整体的波动(变异系数)及趋势变化(时间折线图 环比和同比); 以及A/B测试
- 假设检验分析
提出假设 —> 收集证据 —> 得出结论; (从用户/产品/竞品三个维度提出假设,收集用户数据产品数据竞品数据, 最后用数据去反复验证)
- 相关分析方法
相关分析的作用: 在研究两种或者两种以上数据之间有什么关系或者某个事情收到其他因素影响的问题时,可使用相关分析。
相关系数,通常用r表示,正负表示相关方向,范围为-1~1。-1,1,0为极值。
如何判断两个数据之间是不是 相关关系,需要使用单变量控制方案
- 群组分析方法
按照某个特征,把数据分为不同的组。例子: 按照用户开始使用产品的月份
例子: twitter开始去关注30个好友,是发现的分组"某月份用户用推特的天数"和留存率有关系(核心用户 - 每个月至少访问7天的人/一般用户 - 使用产品不那么频繁的人/冷漠用户-使用一次产品后再也不用的人) 分完组和相对应的比例,再进行假设检验可以思考可能性
- RFM分析方法
R代表Recency 最近一次消费时间,F代表Frequency 消费频次(一段时间), M代表Monetary 消费金额(一段时间)
* 计算RFM的值,用户名称或ID + 消费时间 + 消费金额;
*给RFM值按价值打分,比如将RFM3个指标按照价值从小到大为1~5分,对于R,大于20天的打1分,10~20天打2分,5~10天打3分,3~5天打4分,3天以内打5分
* 计算R F M价值平均值
* 进行用户分类,高于维度价值平均值的为高净值的用户(高低高低高低,区分出8种用户)
* 比如 重要价值用户,RFM三个值都很高
- AARRR模型分析方法
- 漏斗分析方法
- 5W2H (What 是什么,when 何时,where 何地,why 为什么,who是谁)
6. 用多种分析方法解决问题
思路: 确定问题 —> 分析原因—>提出建议
e.g. 某个店铺上半年完成的利润很低,要找出利润没有达标的原因,以及完成年度目标的方案。确定问题是A. 需要明确时间地点和数据来源 B. 明确其涵盖的指标意义和相比较的对象
1) 首先例子中的问题是,利润没有达到目标(计划为3000万,实际完成1991.37万),落后于计划1008.63万,需要解决,以及如何完成下半年指标;其业务指标: 利润的含义如何定义 = 销售收入 - 销售成本 - 营业外支出,销售收入 = 客单价 X 用户数,销售成本 = 商品成本 + 实现销售付出的成本,营业外支出 = 各种非盈利的支出比如捐款等
2) 明确好问题后,我们需要分析原因。此处我们会先对利润进行拆解,按照上面的业务指标可能由这么些要素组成,再去分别追溯数据。发现上半年的销售成本出现明显增长,但销售成本和销售收入直接关系,在费率比逐步下降的情况下,销售费用上升并非是利润不达标的原因。接下来再去分析商品采购成本,与去年上半年同期相比,是低于的,也不是不达标的原因。销售收入对比后发现,今年上半年总销售收入比去年下降了8.79%;再在销售收入的组成元素里去拆解,分析客单价和用户数,发现客单价变化不大反而用户数量下降了。接着去分析用户数量下降的原因。
将用户按照用户,产品,竞品三个维度去拆解,从业务流程出发,去做假设和分析思路
提出建议这一步,通常需要回归分析和AARRR模型。
第二部分: 实战
【电商行业】
模式: B2C,B2B,C2C,O2O模式; 重点业务指标: 新老用户, 复购率(反映忠诚度)和回购率(使用场景不同,分析大促对于用户的吸引力 -- 大促期间购买的用户数/某段时间的购买用户数),人指标 --- 用户交易常用指标包括进店浏览访问UV,加购UV,收藏UV,购买的GMV,支付转化率,折扣率以及退货指标; 货指标 --- 备货指标包括 SPU/SKU数量和备货值,售卖比(GMV/备货值,用来看商品流转情况去优化库存),动销率(有销量的SKU数量/在售的SKU数量)
例子: 2019年双11结束后,某店的KPI未达成,首次交易的新用户数量可观,可能与已购用户销售表现有关(老用户);
> 明确问题: 2019双十一用户回购率下降的原因
> 分析原因: 多维度拆解 + 对比分析法 + 假设检验方法确认原因
大促回购率 = 一定时间的购买人数/当期的购买人数, 已知2017年双11的回购比例8.79%,2018双11的回购比例8.07%,2019双十一回购比例7.71%(用户基数和双11回购人数是一直在增长的,但是由于回购人数的增长率小于回购率的增长,导致整体看下来老用户的回购金额下降。那么新增人数里面哪些人回购表现不佳,变成我们探究的原因。
下面我们来拆解用户,简单的采取以下RFM模型,先从单独R的基数值看,划分不同的老用户 R <=365 365<R<730,目前看没有明显下降。再去拆F,简单拆一下F>1,F=1发现2019年的购买次数1次的用户回购率同比低了9.27%,而购买多次的用户回购率同比只减少了0.81%;只够买一次的用户变二次复购变得更难了。接下来要将F=1的用户单独拿出来进行更细致的分组。
在细致拆分后 发现距离2019.11.11的R为90天和180天的用户,回购率特别低。去提出落地优化方案;
一般电商促销运营活动的数据:
A. 总体运营情况: 备货值,销售额,售卖比,SKU数,SPU数,销量,客单价,UV,收藏数,加购数,转化率,折扣率,毛利率; 一般如何分析?
B. 活动的商品结构, e.g.将数据按照价格维度来拆解,比如500~800的售卖量集中,转化率好。e.g. 按照折扣区间去拆解
【金融信贷行业及金融第三方支付行业】此处不感兴趣就不赘述了
信贷行业模式: 金融机构包括银行,证券公司,保险公司,信托公司,网贷公司,第三方支付公司,金融科技公司等等;
第三方支付公司模式: 为现在商户提供收费终端商品(如扫码枪,付款码等等) 更偏TOB
【家政行业】此处不感兴趣就不赘述了
行业模式: 服务提供方 -->家政平台 <--服务需求方,整体的数据分析也就是一个长业务链每一部分的转化率分析
【旅游行业】
传统模式: 用户 —> 旅行社 —> 安排目的地旅游
新模式: 用户 —> 平台 <—— 旅行社,平台比价和下单; 业务流程指标:下单人数,出游人数,人均团费,复购率/转化率,投诉率
案例: 旅行社想看下投诉对于用户下一年复购的影响,首先先从业务数据上看,有投诉的组和没投诉的组相比,下一年的复购率 一个有43%,一个只有26%,说明相关。然后需要提出建议。// 从业务流程上提出假设,可能是售前,售中,售后做的不好,然后去统计投诉的类型,发现售中投诉占比82%; 再去拆分售中的业务有餐饮交通酒店导游行程等,再去看F地90%总体投诉量集中在售中-行程上。
【在线教育行业】
模式: 录播课+直播课//前台展示通常为App,网站,小程序等。
业务指标: 一般转化方式还是免费课转正价课。免费试学阶段包括:点击次数,点击率,点进概率,弹出率(具体还要看免费课的载体决定,梳理业务转化漏斗) // 观察用户的ARPU ARPPU,付费用户的消费意愿越高,平台收入越多。// 上课学习阶段指标包括 出勤率,完课率,课程评价数,好评率等等;
【运营商行业】
业务模式: 指的是提供网络服务的供应商。i.e. 中国移动,中国联通,中国电信;常见为存量运营,通过电话营销去维系用户和提升用户价值,比如把A套餐换为B套餐;
常用数据指标: 出账用户数,用户保有率,收入保有率,用户流失率,项目增收(某个产品收入增加);
【内容行业】
业务模式: 一般以文章,图片,视频为内容载体去满足用户阅读/学习/消遣需要。
主要指标:
- 内容生产指标
内容生产者比例来衡量一个平台内容的生产健康度;
内容更新总数为内容平台每天更新的内容数,主要分为UGC/PGC
内容更新频次为一段时间内内容更新的总量/时间周期
- 内容曝光指标
人均曝光次数指某类内容的人均曝光次数
- 内容点击指标
内容平均点击数/曝光点击率
- 内容阅读指标
完成阅读的人/总阅读人数,体现内容质量
- 内容评论指标
评论用户数/评论率
- 内容分享指标
用户分享率/内容分享用户数/内容实际产生价值(包括广告/分成/订阅付费等等)