这本《大数据时代》,从整体的宏观层面分析大数据的使用和改变,并冠以‘时代’之名,来全面解析大数据带来的改变。本书的作者维克托·迈尔·舍恩破格,早在2010年就如此准确地预测到大数据时代的到来。如此非凡的洞察力,让人敬佩,作者本人也被称为‘大数据时代的预言家’。而这本系统研究大数据的开山之作也算的是大数据入门的最好选择之一。
本书的共分为三个部分,第一部分,大数据时代思维的变革,包括1.不是样本,而是全部。2.要的不是精确性,而是混杂性。3.需要探求不是因果关系,而是相关性;第二部分,大数据时代的商业变革。也有三个重要的观点,1.一切皆可‘量化’,世界是由信息构成的。2.数据的价值取之不尽用之不竭。3.角色定位,数据、技术、思维的三足鼎立;第三部分,大数据时代的管理变革,主要是谈论让数据主宰一切的风险,以及提出管理这个风险的建议。本文论述主要集中在思维的变革,商业变革和风险管理也会提到其中的观点。
一、大数据时代思维转变,其实本质上看待这个世界的角度发生了改变
1.当数据不需要样本,而是全部
大数据更加精准、有效,小数据容易以偏概全,这里就引出了大数据和小数据的差别所在。小数据采取的是随机抽样的方式,判断事物必定按照人群来分类,比如阿拉伯裔的中东人在机场时可能会有更严格的安检,差学校毕业的学生更容易在面试的时候失败。以偏概全是小数据的特点,是已部分代替整体的所需要付出的必然代价。大数据的样本就是全部,以个人的行为方式来预测一个的行为。一个信誉良好的中东人可能根本不用过安检,一个差学校毕业的学生因为进图书馆、参加的活动多也可能获得企业的青睐。
从个人生活经验的角度,看微信、短信,经常会有漏看信息导致理解出现偏差的例子,这典型地说明要总体不要样本的重要性。要想对一件事有较为全面的了解时,再作出判断。
2.要的不是精确性,而是混杂性。
怎么理解这一句话呢?当数据从样本变为整体的时候,必然会夹杂的许多‘坏’的数据,大数据时代必须学会接纳这种错误。和小数据时代追求样本的准确性不一样,这也是大数据时代一个鲜明的特点。这个‘坏’分为两部分,一部分是真的没有用,另一部分是人类认知没有到达的地方。比如通过一个非常小的细节区分恐怖分子,这种可以量化的数据一旦被发现,带来的收益是巨大的。而这样的数据在没有被发现之前,都是被忽略了的,所以大数据会极大的扩充人类的认知。
从个人的角度,在大城市生活和小城市生活就可以看作是大数据和小数据的区别。在大城市,明显的节奏要快些,所经历的事、接受的信息量都要丰富。这个时候要容忍错误,容忍意外,每一次的不期而遇可能都是因为意外。
3.需要探求的不是因果,而是相关性
在大数据时代,追求两件事的因果可能不是一件很重要的事,而相关性才是最重要的。怎么理解这句话呢?比如蛋挞和飓风用品在超市被放在一块,就因为沃尔玛的数据表明,在飓风来临的时候,某种蛋挞也会大卖。如果这个时候,纠结于飓风导致蛋挞大卖的逻辑原因,显然有些多余与牵强。所以,这个时候仅仅知道是什么就可以,为什么不用考虑为什么?作者在这里表述‘放弃因果,会让我们整个世界的根本都发生改变,现代社会追求原因的动力会被抹杀’。
个人也难以认同这个观点。因果可以认为是多种原因想构成的,每种原因与之相关性有强有弱。比如A原因和B结果有50%的相关性,这里不说A导致了B,而是说明之间有联系。这种逻辑对于认知复杂事物很有帮助。比如个人的成长,受到各种原因的影响,每一种可能都有一个独特的相关性。个人理解是相关性是更清楚的因果论。
二、大数据时代的商业变革
所有关于商业变革的观点,都可以总结为一句话‘世界的本质是数据,一切都可以量化’。从这个角度来说,对于商业的挑战而言,这意味着围绕着数据做一系列的商业行为是未来的样子。亚马逊最大的核心竞争力是他的筛选机制,每个用户对某一本书的阅读时间、在某一页停留的时间、做的笔记和发布的评论,这个数据经过处理后,不只是可以向个人推荐,同时也可以向书商推荐,甚至是向作者推荐。给作者推荐,让作者本人知道作品哪个部分做得好,哪个部分做得不好,这甚至可以帮助作者创造出更加优秀的作品。大数据的价值是真正即将开拓的金矿,大数据带来更加精准的预测,带来更多新型的商业模式。
而在大数据这个局中,有三种角色是互相角逐的对象,即数据的产生者、拥有计算技术的团队、拥有数据思维的组织。每一个公司都应该思考自己扮演哪一种角色。
三、大数据时代的管理变革
作者在这一个部分提出让数据主宰一切的风险,以及提出管理这个风险的建议。让数据主宰一切,有点类似于小说1984中描述的样子,所有的人都被某一庞大的计算机系统控制,不受自己的控制。这样,人类自工业革命以来发展出引以为豪的理性价值、自由价值就变得受打威胁。还有,个人隐私变得越来越透明,大数据甚至可以通过个人的出行这样的数据预测个人适合跟谁结婚。当未来可以被精准的预测是,会有一系列的问题,比如预测一个罪犯有可能犯罪,那应不应该阻止他?我们的法律不可能对一个有可能的犯罪却又没有犯罪的人,给予干涉和审判。
鉴于大数据带来的这么多问题,作者提出了两个重要原则,一,人类只需要为了他的行为负责,而不是被预测的可能性负责;二,谁拥有数据,谁就要对那个数据负责。比如,谷歌就要为他拥有庞大的数据有可能导致不良行为负责。
大数据在这两年非常火,像马云在2016年就开始一直强调阿里是一家大数据公司,BAT在大数据、云计算相关领域的竞争,已经是如火如荼。因为工作的原因,可以接触大量关于人工智能、大数据的方面新闻资讯、干货分享,但是老觉得如管中窥豹,零散的信息并没有给自己的认知带来升级。而这本书给我带来了思维升级的开始。