数据分析思维系列文章第一部分留了一个尾巴,还有一个底层思维——事实思维没有介绍。但是我觉得事实思维可以直接引申到指标思维,因此干脆放到一起说。
先说说什么是事实思维
我们平时表达的内容基本可以分为事实和观点两部分。
美国从小学开始教育如何分辨事实与观点,告诫学生事实不可否认,而观点则可以不认同。事实和观点混淆不清,是无法进行有效思辨和质疑的。
如果和别人辩论,对于事实,你可以用可信的证据去反驳;对于观点,则可以各自表述。
比如,当一个人说:“我觉得今天好热啊!”这就是一个观点陈述,你不能以“今天才28度,不热啊”去反驳他。因为对于说话者,28度可能就算很热了,因为各人的感受和标准是不同的。
但如果一个人说:“今年夏天比去年的温度高多了!”,涉及到事实层面的问题,你就可以拿两年温度对比的数据作为证据去反驳了。
由于中国的学校教育普遍缺失这一部分知识,所以很多中国人搞不清这两者的区别。所以中国人的沟通往往容易陷入一些无畏的争论中。
比如主管批评下属:“你怎么经常迟到!”
下属很容易抗拒,什么叫经常?我才迟到了三次,李四这个月还迟到了四次怎么不说他?然后对话就陷入了对抗模式。
“你怎么经常迟到”这句话是一个观点,代表了主管心目中的评价。如果把观点换做事实,那么沟通会更加容易。
“小张,你本月迟到了3次。”这句话是一个事实,无可辩驳,主管也没有加上评判。
这时候小张的对抗情绪就会淡化很多,更容易找出问题的根源。
数据分析工作的目的是为了提升公司的决策水平。如果不能描述客观事实,那么信息在沟通过程中很容易变形。
如果开会的时候说“本月的销售额大幅下降”这样的观点,不同的人会有不同的理解。有些人会觉得下降20%以上叫大幅下降,有些人觉得下降10%就叫大幅。
如果去掉“大幅”呢?“本月的销售额下降”这句话怎么样?
这是一个事实,但是不同的人理解的可能是不同的事实,因为没有说清所谓的下降是拿什么做对比。所以这个事实很容易造成误解。
说话者脑海中想的可能是相比上个月销售额下降了。但是有些人关注的是和去年同期相比是上升还是下降。
最清晰的事实是“本月的销售额相比上个月下降了10%”。这句话是客观事实,无法改变,每个人获取的信息也是相同的。
团队中每个人拥有相同的信息,才有可能提升决策水平。
这种只说事实不说观点的能力要求很高,人们总是喜欢情绪化的表达。印度哲学家克里希那穆提曾经说过:不带评判的观察是人类智力的最高形式。想要将事实思维融入到日常交流中,需要大量的训练。
这也是数据分析师入门容易,精通难的原因之一。
用指标描述事实
想要保持稳定的说事实的能力,最简单的办法就是把需要衡量的事物数据化。
目前互联网行业里诸如浏览量、活跃用户、响应时间等等指标的应用已经非常普遍了。每个互联网从业者或多或少都知道一些常见的指标。许多指标已经约定俗成,即使你换一家公司,甚至换一个行业,这些指标依然没有沟通成本。比如衡量用户粘性就用留存率,反应产品的流量就用日活月活。
这些基础的数据指标知识,相信你或多或少都有了解。这种基础的监控型的指标这边就不多说了,下文会附上一些常见的数据指标。
不仅指标能提升我们对业务的理解,单单是确定指标的过程,就能极大地提升我们对业务的理解。也就是说,当我们知道我们要用什么指标的时候,我们就能更好的理解业务。
刚才提到,现在的各种指标大家已经很熟悉了,比如留存率、日活用户数等等。但在时间周期拉长了看,会发现互联网行业的指标侧重点是不断变化的。
比如最早的PULSE指标体系,这些指标是用来衡量用户体验的。指标包括:
Page view:页面浏览量
Uptime:正常运行时间
Latency:延迟
Seven days active user:7天活跃用户数
Earning:收益
那个时代对产品的要求很低,只要能解决问题就好,所以这些指标更多地关注产品的可用性。只要确保产品能稳定快速运行,不会出现负面的体验就行了。
随后又发展到HEART指标,也是衡量用户体验的,是PULSE指标的升级版。包括:
Happiness/愉悦度
Engagement/参与度
Adoption/接受度
Retention/留存率
Task success/任务完成度
相比PULSE,HEART指标不单单是注重可用性,而是开始考虑到产品体验的优化。这个时候同类产品开始出现,单纯拼功能已经无法获得竞争优势,而是要在用户使用体验上优化以此获得用户的喜爱,所以增加量愉悦度、参与度等这些维度。
举个例子,原来在没有聊天软件的时候,你只要做到“可用”就可以了。但是到了后来,聊天软件越来越多,有更好体验的产品才能活下来,所以需要考虑用户的更多需求和体验,于是有了群聊、陌生人社交等功能加入。
互联网发展到现在,产品的差异性越来越小,公司之间竞争的阵地从产品切换到运营,于是近几年开始流行基于AARRR的指标体系。
Acquisition:获取,用户如何发现(并来到)你的产品?
Activation:激活,用户的第一次使用体验如何?
Retention:留存,用户是否还会回到产品(重复使用)?
Revenue:收入,产品怎样(通过用户)赚钱?
Refer:传播,用户是否愿意告诉其他用户?
相比之前的指标模型,AARRR站在更加宏观的全局角度审视整个产品,并且更偏向运营。
在过去,用户有自发需求,会去“找”产品。现在的用户,大部分需求都得到了满足,该找的产品都找好了,再想让用户选择自家产品,就需要通过运营手段引起他们的使用兴趣。
所以,现阶段互联网环境下主流的指标体系都是基于AARRR构建的。文章最后一个部分会介绍现有比较常见的基于AARRR的指标体系。
可以看出,确定指标的过程,不仅可以达成“说事实”的结果,还能够帮助自己梳理思路。你知道要量化什么,就说明你清楚了自己更看重什么,你对自己业务的理解往往也就更加清晰了。
如何量化指标?
日常的分析工作中,除了这些基础指标,还会遇到一些特定的业务问题,需要用数据分析解决。比如业务想对比用户对两款产品的喜爱程度,或者衡量APP的稳定性。这种情况下我们该怎么办?
曾任阿里巴巴数据委员会会长的车品觉在《数据的本质》一书中,给出了如何量化问题的方法。
想要量化某个事物,关键是要先搞清楚量化后的数据是为了解决什么问题。如果我们关心X,我们可以通过下列步骤完成量化。
首先,我们要澄清X到底是什么?
比如,你想量化用户对某个功能的喜爱程度,那么究竟什么算是“喜欢这个功能”?是使用频次吗?是使用深度吗?还是用户分享的比例?你需要不断用问题去澄清X到底是什么。
然后考虑如何量化X
如果是使用的深度,那么我们可以量化“使用深度”吗?可以用功能内的停留时长,或者各个子功能的使用广度等等。找到可以用数据衡量的指标来表示“深度”。
最后,量化后的数据能增加我们对X的了解吗?
或者说能降低我们的不确定性吗?
比如“子功能的使用广度”这个指标能让我们确定用户喜欢这个产品吗?如果这个指标比较高的用户只是用户不明白如何使用产品,而进行的探索动作。功能使用率高的用户不能代表用户喜欢这款产品,那么这个数据不能有效降低我们对产品受欢迎程度的了解。
如果量化后的数据对我们理解X没有什么帮助,那么我们就得回到第一步,重新澄清什么是X。
如果你觉得你的业务问题是无论如何都不能用数据量化的,那么我建议你看一下《数据化决策》这本书。我更喜欢这本书的英文名,how to measure anything——如何量化一切。
书中有很多精彩的例子,比如如何衡量数据的价值,如何评估一本书的阅读难度,以及婚姻带来的幸福感等同于多赚多少钱?
有兴趣的朋友,可以读一读。
好的指标长什么样?
《精益数据分析》一书介绍了什么是好的数据指标,好的指标有以下特点:
好的数据指标是比较性的
如果能比较某数据在不同的时间段,用户群体,竞争产品之间的表现,我们可以更好地洞察产品的实际走向。“本周的用户转化率比上周高”显然比“转化率为2%”更有意义。
我们现在的数据大部分都是可对比的,不可对比的数据是哪些呢?
比如一次用户调研,为各个功能的产品体验打分,最高5分,最低1分。这种数据就不容易对比。分数是4的功能相比分数是2的功能,产品体验是2倍的关系吗?显然不是。
好的数据指标是简单易懂的
如果人们不能很容易地记住或讨论某指标,那么通过改变它来改变公司的作为会十分困难。
前不久,一个朋友在交流群里问:过去90日B端用户14天内休眠比例,和B端下单用户次月留存,这两个指标用哪个好?
虽然我并不了解这位朋友的具体业务形态,但是第一个指标很明显太复杂了。如果采用了这个指标,遇到的第一个困难就是如何向团队成员解释这一指标。为什么是过去90天?为什么是14天?
如果要向领导汇报,领导还要花点时间先理解一下这个指标的含义。
相比之下,次月留存的理解成本就非常低,和团队其他成员沟通完全没有障碍。因此我推荐他用更简单的次日留存。
有些指标虽然可能更“贴合业务现状”,但是复杂的指标不利于团队协作,只有少数人理解的精准指标还不如所有人都理解的近似指标。
好的数据指标会改变行为
这是最重要的评判标准,错误的数据指标会引导错误的业务行为。现实中,最常见的导向错误行为的指标是“虚荣指标”,即数字看起来很好看,但是实际上对业务并没有什么帮助。
纯银写过一篇文章《不可靠的数字》,举了很多虚荣指标的案例。
曾经的大众点评,搞了不少“团购消费后发评论赚积分”的活动,评论数大涨,但评论质量很水,不得不用各种算法把这批低质量评论沉下去。这些业务动作的原因是美团的点评数上升很快,大众点评感到了压力。
而国外的TripAdvisor,是旅行行业巨头,在那上面去点评一家酒店,限制必须写50个汉字以上,必须写“标题”与“来访类型”,不写全就不让发。这种机制对点评数KPI是多大的伤害啊。
然而TripAdvisor是全世界最大与最具盛名的旅行点评产品,甩了第二名几百条街。
可见点评数是一个虚荣指标,虽然看起来点评多了,但是实际上垃圾信息也多了,用户体验反而下降。
年前马蜂窝被爆裁员,有人就从指标的角度进行了分析。
马蜂窝本质上是一个旅行攻略的分享网站,基本盘是写攻略 +消费攻略的人。
它的核心策略应该是增加优质内容的供给提升内容分发的效率,围绕日消费超30分钟 的以上的用户持续做优化。
但是马蜂窝在融资以后追求日活数据,采用了一套不适合自己的运营方式。虽然这期间马蜂窝的日活从80万涨到了200万。但是核心用户在最近3个月从26万降低到18万再到现在10万且 持续降低,基本盘差不多都流失了。
产品的核心价值越来越低,自然失去了竞争力。
前不久,有朋友问了我如何衡量产品粘性,用留存率还是流失率。
这两个指标刚好互补,留存率是仍然在使用的用户比例,流失率是不再使用的用户比例。从数学意义上来说,知道了留存率,也就知道了流失率,两者的和肯定等于100%。
那么在业务上,是不是随便用哪个指标都可以用来衡量用户粘性?
要记住,我们选择了什么指标,就会导向什么业务动作。
留存率更加关心的是,从用户获取的角度综合分析获取用户的渠道方式是否合理,产品用户规模是否能够增长。而流失率则关心为什么有些用户离开APP。
如果我们选择了流失率,那么我们就更倾向于流失用户的召回。可能会选择短信召回,老用户礼包等运营方式降低产品的流失率。这些运营动作一旦奏效,就很容易满足于短期运营行为带来的数据优化,失去对产品价值提升的关注。
如果我们选择了留存率,那么我们就更容易聚焦在更具长期价值的工作上,比如产品的优化。
如果产品是稳定期,产品形态已经非常固定,每一个现有用户的流失都会有较大的损失,那么流失率就是比较好的选择。
如果产品还在用户增长阶段,那么留存率可能是更好的选择。
指标的选择很大程度上取决于业务的需求,一定要找到符合当前业务需求的指标。
好的数据指标是一个比率
为什么比率是一个好的指标呢?
因为比率符合前面说的三点。比率比较容易对比,容易理解,而且比率的可操作性强,是行动的向导。
比如一次促销活动的销售收入是10万,而之前是30万,能说活动很失败吗?不一定,我们必须知道覆盖人群,才能衡量这次活动的效果好坏。
也许这次活动覆盖人群只有上次的十分之一,那么我们用转化率作对比,就可以只用一个指标,就能评估这次活动的好坏。
顺便提一下,《精益数据分析》这本书常读常新,我一直建议数据分析师经常看看这本书。
一些常见的业务指标
最后列举一些常见的业务指标,我以目前最常见的AARRR数据指标体系举例。
AARRR分别代表了五个单词,又分别对应了产品生命周期中的五个阶段:
获取(Acquisition):用户如何发现(并来到)你的产品?
激活(Activation):用户的第一次使用体验如何?
留存(Retention):用户是否还会回到产品(重复使用)?
收入(Revenue):产品怎样(通过用户)赚钱?
传播(Refer):用户是否愿意告诉其他用户?
每个步骤下常见的数据指标有:
1. 获取用户(acquisition)
1)日新登用户数
定义:每日注册并登录APP的用户数。
对于一些APP而言,则是首次启动进入APP的用户。所以对于DNU的定义也可以是:首次登录或启动APP的用户。在移动端统计中,一般按设备来计算。
2)注册用户成本
定义:获取一个注册用户的成本
该指标,对于分析各渠道获取注册用户的成本,制定最优的投放计划。
3)ROI
定义:各渠道投资用户的投资产出比
衡量渠道和用户的性价比,找出优质渠道。
2. 提高活跃度(activation)
1)日活跃用户数(DAU)
定义:每日登录过APP的用户数,一般简称日活。
对于某些APP而言,启动就是一个活跃用户,而另一些则要通过账号注册,形成一个网络账号,才算作一个活跃用户。活跃用户的计算是去重的。一个用户一天来N次也只计算一次。
2)周活跃用户数(WAU)
定义:最近7日(含当日)登录过APP的用户数,一般按照自然周计算。
和日活类似。
3)月活跃用户数(MAU)
定义:最近一个月即30日(含当日)登录过APP的用户数,一般按照自然月计算。
MAU变化幅度较小,产品用户规模稳定性来说,MAU是风向标。但在推广时期,版本更新、运营活动的调整,对于MAU的冲击则更加明显。
此外,产品的生命周期阶段不同,MAU的趋势变化也不同。
4)日均使用时长(DAOT)
定义:每日总计在线时长/日活跃用户数。
关于使用时长,可以分为单次使用时长、日使用时长和周使用时长等指标,通过对这些指标做区间分布和平均计算,了解参与黏性。
5)DAU/MAU
通过DAU/MAU可以看出用户每月访问App的平均天数是多少,这是评估用户粘性的一个比较重要的指标。
DAU/MAU介于3.33%到100%之间,但显然这两种情况现实中基本不可能出现。在不同领域的App会有不同的基准值可参考。
DAU/MAU的值越高,说明App的粘性越强,表示有更多的用户愿意使用App。如果DAU/MAU的值很低,并不能直接说这个App是失败的。
3. 留存(retention)
我们需要可以用于衡量用户粘性和质量的指标,这是一种评判APP初期能否留下用户和活跃用户规模增长的手段,留存率(Retention)是手段之一。
1)N日留存率
定义:用户自登录后,在第N日还有登录的用户比例。
一般常用的N日有次日、三日、七日。其中的登录可以根据实际业务情况更换成注册、使用功能等业务动作。
留存率可以判断渠道的真实性和活跃性。
有时,也要关心流失率的分析。
正如之前提到的,留存率和流失率的关注重点不同,根据业务情况不同,选择重点关注留存率或者流失率。
4. 收入(revenue)
收入是平台运营最核心的指标,他直接影响平台及产品能否良好运营下去。
1)付费率(PR或者PUR)
定义:付费用户数占活跃用户的比例。
通俗地说,付费率也称作付费渗透率,在移动APP市场,多数只关心日付费率——即Daily Payment Ratio。
付费率的高低不代表产品的付费用户增加或减少,付费率在不同APP类型的产品中表现也是不同的。该指标可以评估产品的收益转化能力。
2)活跃付费用户数(APA)
定义:在统计时间区间内,成功付费的用户数。一般按照月计,在国际市场也称作MPU(Monthly Paying Users)。
3)平均每用户收入(ARPU)
定义:在统计时间内,活跃用户产生的平均收入。
公式:ARPU=总收入/用户数
国内的ARPU往往计算的是 总收入/付费用户数,实际上国内说的这个口径严格上是ARPPU。ARPU用于产品定位初期的不同规模下的收入估计,也是LTV的重要参考依据。
4)平均每付费用户收入(ARPPU)
定义:在统计时间内,付费用户产生的平均收入。
公式:ARPPU=总收入/付费用户数,即总收入除以总付费用户数。
部分头部用户会影响平均值,分析时需要看一下用户付费金额的分布,尽量避免头部用户和长尾用户的影响。
5)用户生命周期价值(LTV)
定义:客户终生价值,是公司从用户所有的互动中所得到的全部经济收益的总和。
这个指标决定了获取一个用户我们能接受的最大成本,在获客阶段的成本如果超过LTV是不划算的,当然除非正处在砸钱圈用户的阶段。
5. 传播(refer)
互联网时代,用户自传播变得越来越重要。近几年有许多经典的病毒式营销案例,比如拼多多的微信拼团,就是通过用户自发的行为达到产品推广的目的。
1)传播用户数
定义:有分享传播行为的用户人数
一般是已经使用产品的种子用户,该指标可以衡量产品的被认可程度。
2)传播次数
定义:传播用户传播的次数
3)被邀请注册用户数
定义:传播过程中邀请过的转化成注册用户的人数
4)K因子
定义:(每个用户向他的朋友们发出的邀请的数量) * (接收到邀请的人转化为新用户的转化率)。
K因子也被称为病毒系数,用来衡量推荐的效果,即一个发起推荐的用户可以带来多少新用户。
比如用户向用户发起3次邀请,每次邀请转化的比例是30%,那么最终的结果就是3*0.3=0.9,即一个用户会邀请来0.9个新用户。
5)NPS分值
不是所有场景都像互联网一样可以追踪用户的分享行为,很多传播行为是口口相传,这种无法获得推荐和转化率的情况下,NPS分值是较为常用的评估指标。
NPS是通过发放问卷的方式,然后在问卷中问用户有多大的意愿向身边的朋友推荐这款产品,分支分为0-10分,其中0-6分为不推荐,7-8分为不纳入NPS计算范围,9-10分为推荐者。
NPS=【(推荐用户数—不推荐用户数)/返回分数的用户数】*100
通常认为,30分算不错,50分算很好,70分就算优异了。此前的一些调查显示,苹果公司的NPS分值是77分,特斯拉是97分。
写在最后
指标思维的内容并不复杂,难点在于保持“说事实”的习惯。优秀的数据分析师在日常沟通时,是不能出现诸如“一些、有点、非常”这样的模糊词汇的,而是说出具体的数据。
所以本文只是做一个引导,更重要的还是要时时提醒自己,做到冷静的观察,用指标数据代替情绪化思考。
长期坚持,就能忘掉坚持,成为一种思维习惯。
参考文档:
《数据的本质:无人不是数据分析师》车品觉
《精益数据分析》
《数据化决策》
《不可靠的数字》纯银V
如何看待马蜂窝被曝疑似裁员40%,真实性如何?- 章鱼老师的回答
《5分钟建立超详细的AARRR模型数据指标体系》 公众号:从南迹
《talkingdata:互联网金融运营指标体系蓝皮书》