注:此文有大量原文引用,但并无牟利目的,如涉及版权问题,请通知本人下架。另禁止转载。
[格式]
原文摘录
我的批注
如何利用数据更好创业 ——《精益数据分析》读书笔记
仅看第一部分, 即前4章节
本书的最终目的就在于教你如何利用数据更快、更好地创业。
第 1 章 我们都在说谎
1 创业者更需要说谎
怎么说慌
- 对自己说谎
创业者尤其擅于对自己说谎,说谎甚至可以说是创业者取得成功的必备条件。
- 对别人说谎
毕竟,你需要在缺乏充分实证支持的情况下,让别人相信你所说的是真的。你需要信徒对你相当地信任。
为什么要说谎
创业者需处于一种半妄想状态,方能直面创业过程中不可避免的高潮与低谷。
确实很多成功人士都有迷之自信
撒点小谎是必要的。微小的谎言创建了你的现实扭曲场,可谓是创业者的必备要素。
第 2 章 创业的记分牌
数据分析离不开对企业关键指标的跟踪。
1 什么是好的数据指标
- 好的数据指标是
比较性
的
“本周的用户转化率比上周高”显然比“转化率为2%”更有意义。
好的数据指标是简单易懂的
好的数据指标是一个比率
而不是太过具体的数字
2 不同维度划分的指标
定性指标与定量指标
定量数据
排斥主观因素;
定性数据
吸纳主观因素。
虚荣指标与可付诸行动的指标
① 解释
如果你有一个数据,却不知如何根据它采取行动,该数据就仅仅是一个
虚荣指标
每当看到一个指标,就应该下意识地问自己:“依据这个指标,我将如何改变当前的商业行为?”如果回答不了这个问题,你大抵可以不用纠结于这个指标了
② 例子
考虑这样一个例子:“总注册用户数”(或“总用户数”)其实就是一个虚荣指标,这个数字只会随着时间增长(经典的“单调递增函数”)。它并不能传达关于用户行为的信息:他们在做什么?是否对你有价值?他们中的很多人可能只是注册了一下,就再没有使用过。
“总活跃用户数”稍微好些,前提是你对“活跃用户”定义正确。但它依然是一个虚荣指标,也只会随着时间增长,除非你犯了什么严重的错误。
这里真正应该关注的指标,即可付诸行动的指标,是“活跃用户占总用户数的百分比”(活跃用户占比)。
另一个值得关注的指标是“单位时间内新用户的数量”(或“新用户增速”),它对比较不同营销手段的优劣往往很有帮助。
③ 8个需要提防的虚荣数据指标(模式)
创业者容易迷恋“看上去很美”的单调增指标。以下是八个臭名昭著的虚荣指标,对它们敬而远之吧。
点击量 。这是互联网洪荒年代所使用的指标,随便什么网站,只要上面可点的东西多,这个数字都会很高。相比之下,你更应统计点击的人数。
页面浏览量(PV值) 。这个指标只比点击量稍好一点点,因其统计的是网页被访客请求的次数。除非你的商业模式直接与PV值挂钩(即展示广告),你还是更应统计(访问的)人数。
访问量 。你的100访问量究竟来自于1个访问了100次的用户,还是100个访问了1次的用户?它无法指导行动。
独立访客数 。只能显示有多少人访问了网页,却不能告诉你这些人在页面上做了什么?他们为什么停留?是否离开了?
粉丝/好友/赞的数量 。计算粉丝/好友的数量只是一场毫无意义的人气比赛,除非你能让他们做对你有利的事。你在社交平台上振臂一呼时,有多少粉丝会响应?只有知道了这个数字,他们才对你有意义。
网站停留时间(time on site)/浏览页数(number of pages) 。用这两个指标来替代客户参与度或活跃度并非明智之举,除非你的商业模式与这两个指标相绑定。而且,它们并非一定能说明问题。比如,客户在客服或投诉页面上停留了很长时间,不见得是什么好事。
收集到的用户邮件地址数量 。有很多人对你的创业项目感兴趣,这很好。但是,如果不知道他们中有多少人会真正打开你的邮件(并为你邮件中的内容买单),纵使有再多人在你的邮件列表上也是枉然。更好的做法是:向一部分注册用户发送测试邮件,看他们是否会按照邮件中的提示去做。
下载量 。尽管有时会影响你在应用商店中的排名,但下载量本身并不带来价值 4 ;你需要衡量的是:应用下载后的激活量、账号创建量,等等。
探索性指标与报告性指标
唐纳德曾说:世界上的事物可以分为这样几类:
- 我们知道我们知道的,
- 我们知道我们不知道的;
- 我们不知道我们知道的,
- 我们不知道我们不知道的。
具体解释如图:
相比之下,“我们不知道我们不知道的”与创业的关系最紧密, 是探索性指标
我们要主动探索
先见性数据指标与后见性数据指标
① 解释
先见性指标
(或称先见性指示剂 )可用于预测未来。比如,透过“销售漏斗”中现有的潜在客户数,你能大致预测将来所能获得的新客户数
后见性指标
能提示问题的存在,比如用户流失 (即某一时间段内离开某产品或服务的客户量)
不过,等到你有机会收集数据,找出问题,往往为时已晚。已流失的用户不会再回头
后见性和先见性的数据都可以指导行动,区别只是先见性数据能预示将来会发生什么,缩短迭代周期,精益求精。
前提是他本身是可付诸行动的指标
② 例子
在一个企业级软件公司,就销售业绩而言,季度新订单量是一个后见性指标。相对应地,新增潜在客户量是一个先见性指标,它能帮助你提前预测未来的销售业绩。
③ 两者关系
在一个公司中,某一团队的后见性指标有时是另一个团队的先见性指标。例如,季度订单量对于销售团队而言是一个后见性指标(合同已经签订了),但对于财务部门来说,它是一个可以指示营收预期的先见性指标(因为客户还没有支付合同金)。
相关性指标与因果性指标
① 解释
在两个数据指标之间发现相关性
不是一件坏事,发现相关性可以帮助你预测未来
而发现因果关系
意味着你可以改变未来
② 拓展: 大公司有能力测试相关性指标甚至因果性指标
如果拥有一个足够大的用户样本,你甚至可以不用太考虑变量控制就能完成一个很可靠的测试,因为其他自变量对因变量的影响最终会被样本数量拉平,这就是为什么谷歌有能力测试超链接颜色等细微影响因素,为什么微软能够很明确地知道网页加载速度快慢对搜索量的影响。
但是对于大多数创业公司而言,你需要尽量简化你的测试,在很小的样本容量下进行试验,并比较这些测试为你的生意带来的改变。
3 分析方法
市场细分
简言之,细分市场就是一群拥有某种共同特征
的人。
例子:
如果有特别多的高参与度用户来自澳大利亚,你就可以开展调查,找出原因,再将成功要素复制到其他人群中。
同期群分析
比较的是相似群体随时间的变化
。
每一组用户构成一个同期群
,参与整个试验过程。通过比较不同的同期群,你可以获知:从总体上看,关键指标的表现是否越来越好了。
例子:
下例说明同期群分析对创业公司的重要意义。在表2-3中,我们根据用户在网店上的“店龄”来划分数据。这显示了另一个重要的数据指标:用户消费是如何自首月起迅速衰减的。
4 A/B和多变量测试
- 1 A/B测试
① 解释
假设其他条件保持不变,仅考虑体验中的某一属性(如链接的颜色)对被试用户的影响,就是A/B测试
。
例如:
向半数用户展示一个绿色链接,对另一半用户展示蓝色链接,观察哪种颜色的链接点击率更高就是一种横向研究。
拓展:
比较不同群体的同期群试验被称为纵向研究
,因为数据是沿着客户群体的自然生命周期收集的。相对应地,横向研究
指在同一时间段对不同被试群体提供不同的体验。
所以A/B测试属于横向研究
② 缺点
A/B测试看似简单易行,实则有一个软肋。只有用户流量巨大的大型网站(如微软必应、谷歌)能对单一的因素(如链接颜色、网页速度)进行测试并迅速得到答案
- 2 多变量测试
① 解释
进行一连串的单独测试会延长你走向成熟的周期。与其如此,不如采用多变量分析法同时对多个属性进行测试
同时改动产品的多个方面,看哪个与结果的相关性最大.
5 总结
精益数据分析的核心在于如何找到一个有意义的指标,然后通过试验改善它,直到令你满意;之后,转而解决下一个问题,或步入创业的下一个阶段。
第 3 章 你把生命献给谁
1 如何选择职业
巴德·卡德尔用一张极其简单的图概括了人们该如何选择职业,如图3-2所示。
- 千万别从事自己不喜欢的事业。人生苦短,倦怠可期。
- 远不要进入自己没有优势的领域,否则强敌环伺,举步维艰 。
任何企业内部创业最大的敌人都是机会成本——公司可以用同等资源做的任何东西,以及上马你的新项目所牺牲的利润率,都是机会成本。
- 能否挣钱,是三个问题中最本质的一个。
另外两个问题相对简单,因为它们只取决于你个人。但是到了第三个问题,你就必须想清楚到底有没有人愿意为你的产品付钱。
第 4 章 以数据为导向与通过数据获取信息
1 数据分析
重要性
数据分析法是初创企业成功的基石
公司刚成立时规模却很小,全靠创始团队一直坚持采用精益创业思维模式,才得以有条不紊地取得成功。
2 局限性
① 过于迷信
精益创业也面临很多批评的声音,其中之一就是过于以数据为导向。这些批评认为创业不应沦为数据的奴隶,而应将其作为工具;不应被数据牵着鼻子走,而应通过数据获取信息。
有些创业者对数据极度痴迷,几乎到了强迫症的程度,陷于数据分析中跋前疐后,不知所措;另一些则过于随意,拍脑瓜做决策,只看对自己有利的数据,转型信马由缰。
② 局部最优解
早在许多年前,数据分析巨头Omniture的前市场总监盖尔·恩尼斯就曾告诉笔者,作为其内容优化软件的客户,笔者必须坚持用人类的判断来调和机器的自动优化。如果单纯依靠Omniture公司的软件,很快就能算出,网页上衣着暴露的女人图片带来的点入率远比其他形式的内容高得多。但这样得来的高点入率只会是短期的成功,迟早会被其对品牌形象造成的损害所抵消。所以,Omniture软件的背后还有专职的内容运营人员负责在大局上把关,同时为机器的自动测试提供素材元。人类提供灵感,机器负责验证 。
局部最大值
并不是你能取到的最大值
优化的核心是找到给定函数的最大值或最小值。机器虽然具备一定寻找最优解的能力,但其解的范围不可能超过约束条件所规定的区间。
③ 代替不了创新突破
请想象有人给你三个车轮,并要求你制造出最好、最稳定的交通工具。在对不同车轮布局进行迭代之后,你想到了一个类似三轮车的配置。
“嘿!你知道吗?四个车轮比三个更好!”
数学在优化已知系统方面可以做得很好,而人类更善于发现新的系统。换言之,渐进式的改变可以达到局部极限,创新则可能导致全局洗牌。
选择 直觉 还是 数据
在我所认识的创业者中,有许多人都对完全基于数据的创业有一种天生的抵触。他们更愿意相信自己的直觉。他们不喜欢毫无灵魂、单纯机械式的优化,而是深知需要放眼更大的市场,重视正在解决的问题以及基础商业模式。
我们并没有否定直觉
的作用。
不要轻视你的直觉,它十分重要。
你可以通过直觉得知需要设计何种试验来测试你的创业假设,然后利用数据来验证
这些假设。
直觉假设, 数据分析验收