模块一 指标建模
这部分内容分为两部分:
指标详解
数据指标的通用方法论
指标详解
指标详解部分,能够理解指标背后的业务含义,方便在数据指标时候统一概念。
数据指标有很多。只对业务有参考价值的数据进行统计,和当前业务无关的意义不大不要过多关注。
我们应该关注:
谁,做了什么,结果怎样:用户数据,行为数据,业务数据
用户数据:
存量 DAU MAU 日活,月活 daliy/monthly-active-user
增量 新增用户
健康程度 留存率
从哪里来 渠道来源
行为数据:
次数 频率 pv uv 访问深度
路径走通程度 转化率
做了多久 时长
质量 弹出率
业务数据:
总量 gmv 访问时长
人均 arpu arppu 人均访问时长
人数 付费人数 播放人数
健康程度 付费率,付费频次 观看率
被消费对象 思考用户行为之外,sku视角,被消费内容视角
一张图解释:
[]
用户数据
DAU 和 MAU
概念:日活,月活。怎么称之为日,活,活的是是人还是设备还是账号,由于定义不同,背后有坑。
如何判定周期:
日。跨时区比如,最近24h。
月。每天的日活不同,如何算月活。
坑:比如百度统计里,最近30天uv,是累加,而不去重。这就没有价值。月活不是日活之和。当月至少活跃一次的用户总数。
如何判定活跃:
方法一,数据统计系统。事件上报。
有个案例,dau上涨,订单不涨,分析原因是程序员设置push推送了,就进行反馈,不是用户主动点击才上传。
方法二,业务上进行定义关键事件。
触发了关键事件,定义用户活跃。
存在问题:
存在维护成本,需要不断维护日活事件列表。
存在沟通成本。团队内外对活跃的认识。
如何判定用户:认设备,认人。
注意:
一个用户存在多台设备,比如电脑,ipad,手机。
也存在一台设备多个人使用。
认人。给用户以为唯一id。用户数=访问过服务的id数。
如果没有注册,就没有了
认设备。设备唯一id,用户数=访问服务设备数
无法对应设备背后的用户。
有没有账号体系:
没有。认设备
-
有。业务场景是不是强依赖登录
是。认人就行了uid。但仍然需要一个设备id用来描述没有登录的,设备数
-
不是。不登录用户对业务是否有价值
有。比如小说app,阅读行为就有价值。
没有。比如社区类,匿名浏览。
新增用户
不同角色对新增的理念不同:
-
渠道商
点击下载就算新增。
统计简单,但离激活环节最远。
适用场景,量不大,免费渠道,不需要精打细算。
注意事项按照下载按钮结算,无法避免刷量
-
运营
- 下载成功才算,一个用户最多算一次。
-
产品,
按照启动量算。
离激活最近,便于统计
自己比较强势时候适用
-
研发
注册入库了才叫新增用户。
最真实数据,劣势渠道费用激增,下载几块,激活几百块几千块。
适用场景,对用户质量要求高,arpu高
如何判断“增”?
选择合适的节点,算增。应该和渠道算清楚哪个节点算增。
如何判断“新”?
基于设备id。
用户留存
七日留存:
算法一: 七日日留存。第七天除以第一天的百分比。
算法二: 七日内留存。2-7 天用户除以第一天去重百分比。
算法三: 第一天算day0,之后再数7天,那就是 day7 除以 day0 做对比,星期几对齐。
为什么看留存:
日留存,衡量用户表现,了解渠道质量。
观察大盘趋势,周,月留存,记得务必去重。
何时用算法一:
对比渠道质量,用算法一。
以某些天数留存,衡量渠道用户表现。只关心特定日留存。
何时用算法二:
如果产品有使用周期,比如工作日用,非工作日的产品,不太关心第七天还剩下多少,关心周期内的用户。
何时使用算法三:
在日历上,星期几对齐。能抵消星期级别的波动。
渠道来源
网站流量获取渠道,比如:
直接访问
引荐流量
搜索引擎自然流量
付费搜索流量
社交媒体
行为数据
行为数据有哪些:
次数频率:pv uv 访问深度。
路径走通程度:转化率。
举个例子,获取到一些数据,人均访问次数,路径转化效果等:
PV UV 转化率
page views 页面浏览量
unique visitors 独立访问数
app已经不太符合最初定义。pv次数,uv人数。
转化率计算方式:
关注功能 pv/pv
关注业务 uv/uv
关键动作人均触发次数 pv/uv
访问深度
算法一:某些关键行为用户访问次数。比如:视频播放次数。
算法二:功能和内容分层,按照访问层级计算。
如何统计:
web页面打开时长。
app时代,前台驻留时间。
未来,摄像头,瞳孔等未来手段,当然了也要顾虑隐私权。
为何统计时长:
统计特殊事件(比如看视频)
支持业务需求(比如评价质量),比如调查问卷的答题时长。
弹出率 bounce rate
未完待续。。。