花了大概三天左右的时间看完这本书,觉得这本书还是说了一点东西的,但是,含金量并不算高。
这本书主要分三个部分:对思维的变革、对商业的变革与及对管理的变革,下面分开细说。
1、对思维的变革
对于第一部分,作者主要认为有三点:样本=总体;不是精确性,而是混杂性;不追求因果关系,转而追求相关关系。
首先,需要明确的一点是,本书虽然是大数据的先河之作,但具体说的是未来的趋势,并不介绍具体的技术细节,所以就有点是介绍和科普的意味。
对于第一点,由于互联网时代以前,人类收集、储存、分析数据的能力和技术条件有限,无法一一调查所有的对象,所以只好采用抽样调查的方法,这不仅限于人口普查这种特殊的例子(虽然作者举这个例子有些欠缺说服力),而是几乎涉及到所有需要大量数据的场合。但是到了现在,由于数据采集技术的提高与及数据保存的成本下降,数据采集已经不像以前那么困难,所以采集全体数据才能成为现实。这里说的是未来的行业趋势,这种方法会被越来越多的行业和企业所采用,这本身没什么好争议的。网上有一些书评说作者这里说的不对,并举了人口普查、调查零件使用情况和牛奶是否过期都采用抽样调查的例子。对于这几点,需要明确的是,现在大数据才刚兴起,很多方面都还不成熟不完善,但这并不代表作者所言有误。再者,大数据是大方向大潮流,并不意味着所有的情况都要以大数据的视角来看待。人口普查现在无法使用全体数据,但并不代表未来不能实现,而且未来人口普查肯定比现在更省时省力;至于零件使用情况,这种情况本来就是属于抽样调查成本更低的情况。而且同样的技术同样的材料制作出来的零件,其使用寿命应该大致相同。至于牛奶保质期也一样,现在可能需要打开包装来确认,但未来是否能找到新的方法来实行扫描检测进而实现大数据分析呢?这个现在谁也说不定。相对的,书中也举了相关的例子来说明全体数据的好处,虽然某些例子不明就里,但是样本=全体这一点是没问题的,也一定会在未来实现。
对于第二点:不是精确性,而是混杂性。我个人是这样理解的:对于收集到的数据,不是不要求其精确,而是对于精确度的要求没以前那么高了,对错误的容忍度也提高了。否则如果收集到的数据全部都是错误的,那还有什么意义呢?在样本时代,数据不精确会导致对总体的错误估计,有些情况甚至可能是致命的,所以历史上的数学家和统计学家都想尽各种方法来提高数据精确性,但在大数据面前,一些小数据的错误或者不精确可能并不影响总体的趋势,我想,作者是从这个意义上来说的。
对于第三点:不追求因果关系,转而追求相关关系。对于这一点,也许是作者表达不好,也许是翻译不好,很多人都理解成了对因果关系的放弃,包括译者在序里也表达对这一点的不认同。其实综合这一节的全文与及在第三章和后记的内容来看,这样理解是不对的。就像文中所举的例子来看,在大数据揭示了相关性之后,能够快速提供决策所需信息,成本显得低廉,而探求因果关系相对来说则显得费时费力。如果你是老板,你会选哪种?从商业角度来看,相关关系肯定是优先选择。但这是否就意味着放弃了对因果性的追求呢?未必。对因果关系孜孜以求的一直都是科学家、学者这类人物,而不是企业家。再者,现在越来越多的科研成果和学术理论运用到企业生产中,这反而是追求因果关系的那批人给社会的贡献。企业是是利益的追逐者,在大数据以前也并没有追求因果性,这一点并不会因为大数据来了而改变。
2、对商业的变革
这部分主要关于以下三点:万物皆可量化、大数据的价值利用与及企业在大数据时代的定位。
万物皆可量化。这本来就是未来的趋势,只要找到量化的指标,就能把物理世界的物体变为电子世界的数据。
大数据的价值利用这章主要介绍了数据的价值主要在于其潜在价值,一些已经用过的数据经过重新整合和创造性利用能发挥出新的商业效益。主要还是介绍为主。
而企业在大数据时代的定位主要有三个:数据的拥有者或者很容易搜集数据的企业、拥有数据分析技术的企业和拥有创造性思维懂得如何利用大数据的企业。这章虽然也主要是介绍,但作者倾向于认为未来大数据时代的价值还是从大数据本身来发掘。对于这一点,本人不置可否,也并不关心。
3、对管理的变革
这一部分主要分两章:作者对大数据时代的隐忧与及对管理变革的一些建议。
对大数据时代的隐忧主要分两方面:对数据的过分依赖与及对数据的滥用,尤其是对人的监控这方面。这两方面感觉作者都是泛泛而谈,并没有深入的方面,感觉是可有可无的篇章。
至于管理的建议,感觉没看的必要,而且作者提出的观点也不见得有多高明,所以直接跳过了。
总的来说,作者对大数据时代的想法还是有的,尤其是前面三点思维的变革上,虽不能说有什么开创性,但还是让读者了解了大数据时代的特点,对商业的变革上,对企业也有一定的启示,但也并不多,至于第三部分,就有些可有可无了。对于大数据一窍不通的人和商业人士可以读一下,但专业人士可能并不需要。