在很多公司中,都存在一种“多做多错,少做少错,不做不出错”的想法,很多岗位尸位素餐。可是为什么很多商务人士即使捕捉到了能够为公司提高利润的机会,或者发现了导致问题的可能因素,仍不敢提出意见或采取行动呢?
因为他们没有有效的工具帮自己验证问题到底是偶然还是必然,因此只能出于“谨慎”的态度,从不主动主张任何假设,更别说相信假设并采取行动——不做就不会出错嘛——将明明存在的差异自动忽略,总是说“因为未能周密的了解,接下来让我们谨慎的讨论”,然后更多的倾向于不了了之。
但是和这些人相反,有一些商务人士就能够通过有效统计工具,提出假设并验证假设并从中找出商机——比如说从传统酒店财务报表的数据分析中跳出来的市值300多亿的七天快捷酒店——如果是你,这商机,你看得见么?看到了你又敢不敢抓住?
没有人想错失这样的商机,无奈的是不懂得有哪些可以利用的统计工具,以及如何利用他们洞察商机。这本《统计思维》将能让你带你入门。
这本书的作者西内启是日本畅销统计学入门书籍《看穿一切数字的统计学》的作者,他认为自己这本书应该算作统计学入门的入门,那个时候他只希望通过自己的书让更多的人关注到统计学,进而去找到适合自己的统计学入门书籍进行阅读。而读者们的反馈让他意识到大多数统计学入门教科书并不符合商务人士的需求。
因此作者西内启写这本《统计思维》的初衷就是希望写出一本适合商务人士看的、为了商业目的提供的统计学教科书。
统计学在商务上的应用,主要在于“把握现状”、“预测未来”、“洞察人类行为的因果关系”这三个方面。西内启的这本书主要涉及的是“洞察人类行为的统计学”,以人类的行为和社会状态的变化为主要研究对象,目标是用数据来洞察个人和集团的行为,进而寻找对其行动和状态进行改善的方法。
通俗来说,商务人士可以利用统计工具、通过数据分析,了解和他的业务相关的所有相关人(比如消费者)或企业(比如供应商、渠道商)的行为,从而找到提高商业利润的方法。
西内启自己就是这样一名善于利用统计工具的商务人士。西内启提到,自己从年轻时开始直到现在,每日都在运用统计学技术分析横跨各领域的实证数据并将其活用;他认为正是这样职业基础,让他更懂得如何将统计知识活用于商业活动,才让他更容易写出适合商务人士看的统计学入门书。
那么商务人士认为现有统计学入门书不适合他们的理由到底有哪些呢?
1、出现公式就读不下去
2、乍一接触到统计工具,不知道它的含义
3、不知道各种方法对自己的工作有何助益
4、不知道自己工作适用哪些统计学知识
这本书和以上所说的“现有统计学入门书”又有哪些不同呢?
1、本书正文中尽量少的出现公式,即使有少量公式,也尽量用文字进行表述而非字母和符号。
所有的公式及其证明都集中在正文后面的《数学附录》(本书的275-347页)中,但作者确实做到了即使不看正文后面的《数学附录》,也能清楚的明白作者想要表述的意思。
2、在介绍各个统计工具/方法时,书中使用了大量商务中的实例,让我们清楚的了解到这些工具的除了数理含义之外的实用含义,以及在工作中的作用。
比如说,在第二章解释“统计学假设检验”这个工具时,用商务中人力资源的“参加了体育社团是否在工作中更容易成功”案例来说明,让人很清楚的意识到原来“统计学假设检验”这个工具是用来判断,两个事件之间的联系是偶然还是必然;同时这种验证能够让我们规避在商务中冒进的决断或者因为不确定而产生的不作为的消极态度。
3、本书终章部分向我们介绍了商务中书中的各统计知识和工具可以在什么情况下被用到,以及在商务实践中我们可以以什么顺序去运用到这些知识进行分析思考。
终章部分,就像这本书的领子一般,建议商务人士可以在阅读完序章后,直接跳到这部分,先去了解这本书中介绍的各种知识使用顺序和使用情景,也许就能以更清晰的目标完成本书的阅读了。
最开始,你要了解两个核心概念:
1)outcome——你最终想要控制的结果。
举例来说,你想要的结果可以是提高用户消费金额,或是降低用户投诉率,或提高用户忠诚度。
2)解释变量——和outcome有因果关系,可以帮助你控制outcome的原因。
举例来说,用户的年龄、性别、职业可能都会成为影响用户消费金额的因素。
商务实践中利用统计学进行分析,到底要按照什么顺序、使用到哪些知识呢?
首先第一步是数据整理和查验
这一点,并没有在本书中用更大的篇幅说明,而只是在终章的最后提到你可能会使用到的统计分析工具与实际数据的处理。SAS、R、Excle这些常用的工具很容易获得和使用,但工具的熟练使用并不代表你一定能够在商务上利用数据有更好表现,更为重要的是“从实际数据中找出outcome与解释变量是什么的能力”和“加工现有数据的能力”。
因此在完成数据整理和查验之后,第二步最重要的就是确定想要最大化活着最小化的outcome是什么。这一步的核心则在于对于业务目标本身的深刻理解。
第三步就是寻找outcome有因果关联的解释变量。
可能和outcome有关联的解释变量非常多,选择什么样的解释变量才有分析价值呢?
基本原则有三:
1)最好寻找那些可以通过广告、商品制造等手段或方法可以操控的解释变量,以便通过操纵该解释变量创造利润。
比如说选择“品牌形象信任度”这样的解释变量,可以通过投放广告这样的方式提高,以达到增加销售的目标。
2)选择那些即使不可以操控,但却可以“调整”的解释变量,通过调整改变量创造利润。
这是什么意思呢?举例来说,某品牌发现自己的产品女性消费者的消费金额比男性更高,即使我们不能改变到店顾客的性别,我们可以调整其他因素(比如广告投放渠道、店面选址或装修风格等),让女性消费者更容易获知该品牌信息、更容易被吸引到店等。
3)选择那些即使无法直接提高收益,但在其他角度和利益相关(比如说减少成本)的解释变量。
这一步中可以使用的统计工具是是“多元回归分析”和“Logistic回归分析”,通过分析关联性寻找想法,解释结果。这一步中在必要的时候,通过统计工具“因子分析”/“聚类分析”精简数据。
第四步就是尝试从分析结果中得出结果。
获得的结果是否具有必然性,可以通过统计工具需要进行验证。在商务中可以采取小规模的A/B测试的方法进行检验,使用t验证或z检验验证A/B测试的结果,验证想法的有效性。
作者对于从统计数据中获得的可能存在的商业机会的态度非常明确和积极,那就是“如果发现了可能带来利益的想法,就用恰当的随机对照试验或A/B测试去验证它”。
以上所有提到的统计工具都可以在本书的第1-4章找到。同时在书的最后《数学附录》中可以找到相应公式及其证明。
我们生活在一个一切都被数据化的时代,只有备好有力的统计工具,才能拥有透过数据参看世界真相的洞察能力,获得先机啊。