数据分析思维系列文章第一部分留了一个尾巴，还有一个底层思维——事实思维没有介绍。但是我觉得事实思维可以直接引申到指标思维，因此干脆放到一起说。

先说说什么是事实思维

我们平时表达的内容基本可以分为事实和观点两部分。

美国从小学开始教育如何分辨事实与观点，告诫学生事实不可否认，而观点则可以不认同。事实和观点混淆不清，是无法进行有效思辨和质疑的。

如果和别人辩论，对于事实，你可以用可信的证据去反驳；对于观点，则可以各自表述。

比如，当一个人说：“我觉得今天好热啊！”这就是一个观点陈述，你不能以“今天才28度，不热啊”去反驳他。因为对于说话者，28度可能就算很热了，因为各人的感受和标准是不同的。

但如果一个人说：“今年夏天比去年的温度高多了！”，涉及到事实层面的问题，你就可以拿两年温度对比的数据作为证据去反驳了。

由于中国的学校教育普遍缺失这一部分知识，所以很多中国人搞不清这两者的区别。所以中国人的沟通往往容易陷入一些无畏的争论中。

比如主管批评下属：“你怎么经常迟到！”

下属很容易抗拒，什么叫经常？我才迟到了三次，李四这个月还迟到了四次怎么不说他？然后对话就陷入了对抗模式。

“你怎么经常迟到”这句话是一个观点，代表了主管心目中的评价。如果把观点换做事实，那么沟通会更加容易。

“小张，你本月迟到了3次。”这句话是一个事实，无可辩驳，主管也没有加上评判。

这时候小张的对抗情绪就会淡化很多，更容易找出问题的根源。

数据分析工作的目的是为了提升公司的决策水平。如果不能描述客观事实，那么信息在沟通过程中很容易变形。

如果开会的时候说“本月的销售额大幅下降”这样的观点，不同的人会有不同的理解。有些人会觉得下降20%以上叫大幅下降，有些人觉得下降10%就叫大幅。

如果去掉“大幅”呢？“本月的销售额下降”这句话怎么样？

这是一个事实，但是不同的人理解的可能是不同的事实，因为没有说清所谓的下降是拿什么做对比。所以这个事实很容易造成误解。

说话者脑海中想的可能是相比上个月销售额下降了。但是有些人关注的是和去年同期相比是上升还是下降。

最清晰的事实是“本月的销售额相比上个月下降了10%”。这句话是客观事实，无法改变，每个人获取的信息也是相同的。

团队中每个人拥有相同的信息，才有可能提升决策水平。

这种只说事实不说观点的能力要求很高，人们总是喜欢情绪化的表达。印度哲学家克里希那穆提曾经说过：不带评判的观察是人类智力的最高形式。想要将事实思维融入到日常交流中，需要大量的训练。

这也是数据分析师入门容易，精通难的原因之一。

用指标描述事实

想要保持稳定的说事实的能力，最简单的办法就是把需要衡量的事物数据化。

目前互联网行业里诸如浏览量、活跃用户、响应时间等等指标的应用已经非常普遍了。每个互联网从业者或多或少都知道一些常见的指标。许多指标已经约定俗成，即使你换一家公司，甚至换一个行业，这些指标依然没有沟通成本。比如衡量用户粘性就用留存率，反应产品的流量就用日活月活。

这些基础的数据指标知识，相信你或多或少都有了解。这种基础的监控型的指标这边就不多说了，下文会附上一些常见的数据指标。

不仅指标能提升我们对业务的理解，单单是确定指标的过程，就能极大地提升我们对业务的理解。也就是说，当我们知道我们要用什么指标的时候，我们就能更好的理解业务。

刚才提到，现在的各种指标大家已经很熟悉了，比如留存率、日活用户数等等。但在时间周期拉长了看，会发现互联网行业的指标侧重点是不断变化的。

比如最早的PULSE指标体系，这些指标是用来衡量用户体验的。指标包括：

Page view:页面浏览量

Uptime:正常运行时间

Latency:延迟

Seven days active user:7天活跃用户数

Earning:收益

那个时代对产品的要求很低，只要能解决问题就好，所以这些指标更多地关注产品的可用性。只要确保产品能稳定快速运行，不会出现负面的体验就行了。

随后又发展到HEART指标，也是衡量用户体验的，是PULSE指标的升级版。包括：

Happiness/愉悦度

Engagement/参与度

Adoption/接受度

Retention/留存率

Task success/任务完成度

相比PULSE，HEART指标不单单是注重可用性，而是开始考虑到产品体验的优化。这个时候同类产品开始出现，单纯拼功能已经无法获得竞争优势，而是要在用户使用体验上优化以此获得用户的喜爱，所以增加量愉悦度、参与度等这些维度。

举个例子，原来在没有聊天软件的时候，你只要做到“可用”就可以了。但是到了后来，聊天软件越来越多，有更好体验的产品才能活下来，所以需要考虑用户的更多需求和体验，于是有了群聊、陌生人社交等功能加入。

互联网发展到现在，产品的差异性越来越小，公司之间竞争的阵地从产品切换到运营，于是近几年开始流行基于AARRR的指标体系。

Acquisition：获取，用户如何发现（并来到）你的产品？

Activation：激活，用户的第一次使用体验如何？

Retention：留存，用户是否还会回到产品（重复使用）？

Revenue：收入，产品怎样（通过用户）赚钱？

Refer：传播，用户是否愿意告诉其他用户？

相比之前的指标模型，AARRR站在更加宏观的全局角度审视整个产品，并且更偏向运营。

在过去，用户有自发需求，会去“找”产品。现在的用户，大部分需求都得到了满足，该找的产品都找好了，再想让用户选择自家产品，就需要通过运营手段引起他们的使用兴趣。

所以，现阶段互联网环境下主流的指标体系都是基于AARRR构建的。文章最后一个部分会介绍现有比较常见的基于AARRR的指标体系。

可以看出，确定指标的过程，不仅可以达成“说事实”的结果，还能够帮助自己梳理思路。你知道要量化什么，就说明你清楚了自己更看重什么，你对自己业务的理解往往也就更加清晰了。

如何量化指标？

日常的分析工作中，除了这些基础指标，还会遇到一些特定的业务问题，需要用数据分析解决。比如业务想对比用户对两款产品的喜爱程度，或者衡量APP的稳定性。这种情况下我们该怎么办？

曾任阿里巴巴数据委员会会长的车品觉在《数据的本质》一书中，给出了如何量化问题的方法。

想要量化某个事物，关键是要先搞清楚量化后的数据是为了解决什么问题。如果我们关心X，我们可以通过下列步骤完成量化。

首先，我们要澄清X到底是什么？

比如，你想量化用户对某个功能的喜爱程度，那么究竟什么算是“喜欢这个功能”？是使用频次吗？是使用深度吗？还是用户分享的比例？你需要不断用问题去澄清X到底是什么。

然后考虑如何量化X

如果是使用的深度，那么我们可以量化“使用深度”吗？可以用功能内的停留时长，或者各个子功能的使用广度等等。找到可以用数据衡量的指标来表示“深度”。

最后，量化后的数据能增加我们对X的了解吗？

或者说能降低我们的不确定性吗？

比如“子功能的使用广度”这个指标能让我们确定用户喜欢这个产品吗？如果这个指标比较高的用户只是用户不明白如何使用产品，而进行的探索动作。功能使用率高的用户不能代表用户喜欢这款产品，那么这个数据不能有效降低我们对产品受欢迎程度的了解。

如果量化后的数据对我们理解X没有什么帮助，那么我们就得回到第一步，重新澄清什么是X。

如果你觉得你的业务问题是无论如何都不能用数据量化的，那么我建议你看一下《数据化决策》这本书。我更喜欢这本书的英文名，how to measure anything——如何量化一切。

书中有很多精彩的例子，比如如何衡量数据的价值，如何评估一本书的阅读难度，以及婚姻带来的幸福感等同于多赚多少钱？

有兴趣的朋友，可以读一读。

好的指标长什么样？

《精益数据分析》一书介绍了什么是好的数据指标，好的指标有以下特点：

好的数据指标是比较性的

如果能比较某数据在不同的时间段，用户群体，竞争产品之间的表现，我们可以更好地洞察产品的实际走向。“本周的用户转化率比上周高”显然比“转化率为2%”更有意义。

我们现在的数据大部分都是可对比的，不可对比的数据是哪些呢？

比如一次用户调研，为各个功能的产品体验打分，最高5分，最低1分。这种数据就不容易对比。分数是4的功能相比分数是2的功能，产品体验是2倍的关系吗？显然不是。

好的数据指标是简单易懂的

如果人们不能很容易地记住或讨论某指标，那么通过改变它来改变公司的作为会十分困难。

前不久，一个朋友在交流群里问：过去90日B端用户14天内休眠比例，和B端下单用户次月留存，这两个指标用哪个好？

虽然我并不了解这位朋友的具体业务形态，但是第一个指标很明显太复杂了。如果采用了这个指标，遇到的第一个困难就是如何向团队成员解释这一指标。为什么是过去90天？为什么是14天？

如果要向领导汇报，领导还要花点时间先理解一下这个指标的含义。

相比之下，次月留存的理解成本就非常低，和团队其他成员沟通完全没有障碍。因此我推荐他用更简单的次日留存。

有些指标虽然可能更“贴合业务现状”，但是复杂的指标不利于团队协作，只有少数人理解的精准指标还不如所有人都理解的近似指标。

好的数据指标会改变行为

这是最重要的评判标准，错误的数据指标会引导错误的业务行为。现实中，最常见的导向错误行为的指标是“虚荣指标”，即数字看起来很好看，但是实际上对业务并没有什么帮助。

纯银写过一篇文章《不可靠的数字》，举了很多虚荣指标的案例。

曾经的大众点评，搞了不少“团购消费后发评论赚积分”的活动，评论数大涨，但评论质量很水，不得不用各种算法把这批低质量评论沉下去。这些业务动作的原因是美团的点评数上升很快，大众点评感到了压力。

而国外的TripAdvisor，是旅行行业巨头，在那上面去点评一家酒店，限制必须写50个汉字以上，必须写“标题”与“来访类型”，不写全就不让发。这种机制对点评数KPI是多大的伤害啊。

然而TripAdvisor是全世界最大与最具盛名的旅行点评产品，甩了第二名几百条街。

可见点评数是一个虚荣指标，虽然看起来点评多了，但是实际上垃圾信息也多了，用户体验反而下降。

年前马蜂窝被爆裁员，有人就从指标的角度进行了分析。

马蜂窝本质上是一个旅行攻略的分享网站，基本盘是写攻略 +消费攻略的人。

它的核心策略应该是增加优质内容的供给提升内容分发的效率，围绕日消费超30分钟的以上的用户持续做优化。

但是马蜂窝在融资以后追求日活数据，采用了一套不适合自己的运营方式。虽然这期间马蜂窝的日活从80万涨到了200万。但是核心用户在最近3个月从26万降低到18万再到现在10万且持续降低，基本盘差不多都流失了。

产品的核心价值越来越低，自然失去了竞争力。

前不久，有朋友问了我如何衡量产品粘性，用留存率还是流失率。

这两个指标刚好互补，留存率是仍然在使用的用户比例，流失率是不再使用的用户比例。从数学意义上来说，知道了留存率，也就知道了流失率，两者的和肯定等于100%。

那么在业务上，是不是随便用哪个指标都可以用来衡量用户粘性？

要记住，我们选择了什么指标，就会导向什么业务动作。

留存率更加关心的是，从用户获取的角度综合分析获取用户的渠道方式是否合理，产品用户规模是否能够增长。而流失率则关心为什么有些用户离开APP。

如果我们选择了流失率，那么我们就更倾向于流失用户的召回。可能会选择短信召回，老用户礼包等运营方式降低产品的流失率。这些运营动作一旦奏效，就很容易满足于短期运营行为带来的数据优化，失去对产品价值提升的关注。

如果我们选择了留存率，那么我们就更容易聚焦在更具长期价值的工作上，比如产品的优化。

如果产品是稳定期，产品形态已经非常固定，每一个现有用户的流失都会有较大的损失，那么流失率就是比较好的选择。

如果产品还在用户增长阶段，那么留存率可能是更好的选择。

指标的选择很大程度上取决于业务的需求，一定要找到符合当前业务需求的指标。

好的数据指标是一个比率

为什么比率是一个好的指标呢？

因为比率符合前面说的三点。比率比较容易对比，容易理解，而且比率的可操作性强，是行动的向导。

比如一次促销活动的销售收入是10万，而之前是30万，能说活动很失败吗？不一定，我们必须知道覆盖人群，才能衡量这次活动的效果好坏。

也许这次活动覆盖人群只有上次的十分之一，那么我们用转化率作对比，就可以只用一个指标，就能评估这次活动的好坏。

顺便提一下，《精益数据分析》这本书常读常新，我一直建议数据分析师经常看看这本书。

一些常见的业务指标

最后列举一些常见的业务指标，我以目前最常见的AARRR数据指标体系举例。

AARRR分别代表了五个单词，又分别对应了产品生命周期中的五个阶段：

获取（Acquisition）：用户如何发现（并来到）你的产品？

激活（Activation）：用户的第一次使用体验如何？

留存（Retention）：用户是否还会回到产品（重复使用）？

收入（Revenue）：产品怎样（通过用户）赚钱？

传播（Refer）：用户是否愿意告诉其他用户？

每个步骤下常见的数据指标有：

1. 获取用户（acquisition）

1）日新登用户数

定义：每日注册并登录APP的用户数。

对于一些APP而言，则是首次启动进入APP的用户。所以对于DNU的定义也可以是：首次登录或启动APP的用户。在移动端统计中，一般按设备来计算。

2）注册用户成本

定义：获取一个注册用户的成本

该指标，对于分析各渠道获取注册用户的成本，制定最优的投放计划。

3）ROI

定义：各渠道投资用户的投资产出比

衡量渠道和用户的性价比，找出优质渠道。

2. 提高活跃度（activation）

1）日活跃用户数（DAU）

定义：每日登录过APP的用户数，一般简称日活。

对于某些APP而言，启动就是一个活跃用户，而另一些则要通过账号注册，形成一个网络账号，才算作一个活跃用户。活跃用户的计算是去重的。一个用户一天来N次也只计算一次。

2）周活跃用户数（WAU）

定义：最近7日（含当日）登录过APP的用户数，一般按照自然周计算。

和日活类似。

3）月活跃用户数(MAU)

定义：最近一个月即30日（含当日）登录过APP的用户数，一般按照自然月计算。

MAU变化幅度较小，产品用户规模稳定性来说，MAU是风向标。但在推广时期，版本更新、运营活动的调整，对于MAU的冲击则更加明显。

此外，产品的生命周期阶段不同，MAU的趋势变化也不同。

4）日均使用时长(DAOT)

定义：每日总计在线时长/日活跃用户数。

关于使用时长，可以分为单次使用时长、日使用时长和周使用时长等指标，通过对这些指标做区间分布和平均计算，了解参与黏性。

5）DAU/MAU

通过DAU/MAU可以看出用户每月访问App的平均天数是多少，这是评估用户粘性的一个比较重要的指标。

DAU/MAU介于3.33%到100%之间，但显然这两种情况现实中基本不可能出现。在不同领域的App会有不同的基准值可参考。

DAU/MAU的值越高，说明App的粘性越强，表示有更多的用户愿意使用App。如果DAU/MAU的值很低，并不能直接说这个App是失败的。

3. 留存（retention）

我们需要可以用于衡量用户粘性和质量的指标，这是一种评判APP初期能否留下用户和活跃用户规模增长的手段，留存率（Retention）是手段之一。

1）N日留存率

定义：用户自登录后，在第N日还有登录的用户比例。

一般常用的N日有次日、三日、七日。其中的登录可以根据实际业务情况更换成注册、使用功能等业务动作。

留存率可以判断渠道的真实性和活跃性。

有时，也要关心流失率的分析。

正如之前提到的，留存率和流失率的关注重点不同，根据业务情况不同，选择重点关注留存率或者流失率。

4. 收入（revenue）

收入是平台运营最核心的指标，他直接影响平台及产品能否良好运营下去。

1）付费率(PR或者PUR)

定义：付费用户数占活跃用户的比例。

通俗地说，付费率也称作付费渗透率，在移动APP市场，多数只关心日付费率——即Daily Payment Ratio。

付费率的高低不代表产品的付费用户增加或减少，付费率在不同APP类型的产品中表现也是不同的。该指标可以评估产品的收益转化能力。

2）活跃付费用户数(APA)

定义：在统计时间区间内，成功付费的用户数。一般按照月计，在国际市场也称作MPU（Monthly Paying Users）。

3）平均每用户收入(ARPU)

定义：在统计时间内，活跃用户产生的平均收入。

公式：ARPU＝总收入/用户数

国内的ARPU往往计算的是总收入/付费用户数，实际上国内说的这个口径严格上是ARPPU。ARPU用于产品定位初期的不同规模下的收入估计，也是LTV的重要参考依据。

4）平均每付费用户收入(ARPPU)

定义：在统计时间内，付费用户产生的平均收入。

公式：ARPPU＝总收入/付费用户数，即总收入除以总付费用户数。

部分头部用户会影响平均值，分析时需要看一下用户付费金额的分布，尽量避免头部用户和长尾用户的影响。

5）用户生命周期价值（LTV）

定义：客户终生价值，是公司从用户所有的互动中所得到的全部经济收益的总和。

这个指标决定了获取一个用户我们能接受的最大成本，在获客阶段的成本如果超过LTV是不划算的，当然除非正处在砸钱圈用户的阶段。

5. 传播（refer）

互联网时代，用户自传播变得越来越重要。近几年有许多经典的病毒式营销案例，比如拼多多的微信拼团，就是通过用户自发的行为达到产品推广的目的。

1）传播用户数

定义：有分享传播行为的用户人数

一般是已经使用产品的种子用户，该指标可以衡量产品的被认可程度。

2）传播次数

定义：传播用户传播的次数

3）被邀请注册用户数

定义：传播过程中邀请过的转化成注册用户的人数

4）K因子

定义：(每个用户向他的朋友们发出的邀请的数量) * (接收到邀请的人转化为新用户的转化率)。

K因子也被称为病毒系数，用来衡量推荐的效果，即一个发起推荐的用户可以带来多少新用户。

比如用户向用户发起3次邀请，每次邀请转化的比例是30%，那么最终的结果就是3*0.3=0.9，即一个用户会邀请来0.9个新用户。

5）NPS分值

不是所有场景都像互联网一样可以追踪用户的分享行为，很多传播行为是口口相传，这种无法获得推荐和转化率的情况下，NPS分值是较为常用的评估指标。

NPS是通过发放问卷的方式，然后在问卷中问用户有多大的意愿向身边的朋友推荐这款产品，分支分为0-10分，其中0-6分为不推荐，7-8分为不纳入NPS计算范围，9-10分为推荐者。

NPS=【（推荐用户数—不推荐用户数）/返回分数的用户数】*100

通常认为，30分算不错，50分算很好，70分就算优异了。此前的一些调查显示，苹果公司的NPS分值是77分，特斯拉是97分。

写在最后

指标思维的内容并不复杂，难点在于保持“说事实”的习惯。优秀的数据分析师在日常沟通时，是不能出现诸如“一些、有点、非常”这样的模糊词汇的，而是说出具体的数据。

所以本文只是做一个引导，更重要的还是要时时提醒自己，做到冷静的观察，用指标数据代替情绪化思考。

长期坚持，就能忘掉坚持，成为一种思维习惯。

参考文档：

《数据的本质：无人不是数据分析师》车品觉

《精益数据分析》

《数据化决策》

《不可靠的数字》纯银V

如何看待马蜂窝被曝疑似裁员40%，真实性如何？- 章鱼老师的回答

《5分钟建立超详细的AARRR模型数据指标体系》公众号：从南迹

《talkingdata：互联网金融运营指标体系蓝皮书》

数据分析基础思维之：指标思维