这本书毫不犹豫给五星好评。大数据怎么理解?就是指海量的信息。信息又是什么?文字、图片、音频、视频等都是信息的常规表现形式,信息当然还有其他形式。
1,关于引言。引言部分值得拜读。引言概括了本书的主要内容,读引言可以让读者抓住重点内容。引言:一场生活、工作与思维的大变革。大数据,变革公共卫生(谷歌搜索预测流感);大数据,变革商业(Farecast预测机票价格);大数据,变革思维(大数据时代,数据已经成为一种商业资本,可以用来激发新产品和新服务,大数据可以改变市场、组织机构、以及政府与公民的关系,创造新价值,创造经济利益;大数据时代,社会可以减弱对因果关系的渴求,仅需要关注相关关系,只需要知道"是什么",不需要知道为什么,因果关系只是一种特殊的相关关系);大数据,开启重大的时代转型(大数据以及撼动了世界的方方面面,从商业、科技、医疗、教育、到经济、人文等各个领域,大数据的科学价值和社会价值不可限量);预测,大数据的核心(分析海量的数据来预测事件的可能性,比如识别潜在的犯罪分子);大数据的精髓(改变了我们分析信息的模式,改变了我们理解和组建社会的方法:A,大数据不是从数据中抽样分析,而是分析所有的数据,或者说是"样本"="总体"、B,大数据允许出现不准确的数据,错误的数据也可以变得有价值、C,由因果关系向相关关系转化时会释放出潜在的价值);大数据,大挑战(如何保护个人隐私?大数据预测出错责任谁来承担?如何防止数据垄断独裁?)。引言总结:大数据正在改变我们的生活以及理解世界的方式。寻找原因是一种现代社会的一神论,大数据推翻了这个论断。但我们又陷入了一个历史的困境,那就是我们活在一个"上帝已死"的时代。那么,从经验中得来的与证据相矛盾的直觉、信念和迷惘应该充当什么角色呢?当世界由探求因果关系变成挖掘相关关系,我们怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类前行的基石,又取得实际的进步呢?本书意在解释我们身在何处,我们从何而来,并且提供当下亟需的指导,以应对眼前的利益和危险。
2,正文精彩摘要。
2.1,大数据时代思维变革(A,首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。B,其次,我们乐于接受数据的纷繁复杂,而不再追求精确性。C,最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系,因果关系只是特殊的相关关系。);
2.2,拥抱数据的不完美。当我们的视野局限在我们可以分析和能够确定的数据上时,我们对世界的整体理解就可能产生偏差和错误。大数据帮助我们进一步接近事实的真相。(宽容错误会给我们带来更多价值(谷歌的翻译之所以更好并不是因为它拥有一个更好的算法机制。和微软的班科和布里尔一样,这是因为谷歌翻译增加了很多各种各样的数据。从谷歌的例子来看,它之所以能比IBM的Candide系统多利用成千上万的数据,是因为它接受了有错误的数据。"略有瑕疵的答案不会伤了商家的胃口"。但是对于有些事情,快速获得一个大概的轮廓和发展脉络,就要比严格的精确性要重要得多。只要我们能够得到一个事物更完整的概念,我们就能接受模糊和不确定的存在。就像印象派的画风一样,近看画中的每一笔都感觉是混乱的,但是退后一步你就会发现这是一幅伟大的作品,因为你退后一步的时候就能看出画作的整体思路了。相比依赖于小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,帮助我们进一步接近事实的真相。“部分”和“确切”的吸引力是可以理解的。但是,当我们的视野局限在我们可以分析和能够确定的数据上时,我们对世界的整体理解就可能产生偏差和错误。不仅失去了去尽力收集一切数据的动力,也失去了从各个不同角度来观察事物的权利。所以,局限于狭隘的小数据中,我们可以自豪于对精确性的追求,但是就算我们可以分析得到细节中的细节,也依然会错过事物的全貌。大数据要求我们有所改变,我们必须能够接受混乱和不确定性。精确性似乎一直是我们生活的支撑,就像我们常说的“钉是钉,铆是铆”。但认为每个问题只有一个答案的想法是站不住脚的,不管我们承不承认。一旦我们承认了这个事实甚至拥护这个事实的话,我们离真相就又近了一步。这些思想上的重大转变导致了第三个变革,这个变革有望颠覆很多传统观念。这些传统观念更加基本,往往被认为是社会建立的根基:找到一切事情发生背后的原因。然而其实很多时候,寻找数据间的关联并利用这种关联就足够了。);
2.3,大数据价值链的3大构成(根据所提供价值的不同来源,分别出现了三种大数据公司。这三种来源是指:A,数据本身、技能与思维。第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。最好的例子就是Twitter,它拥有海量数据这一点是毫无疑问的,但是它的数据都通过两个独立的公司授权给别人使用。B,第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或提出数据创新性用途的才能。比方说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司(Teradata)的分析来获得营销点子,天睿就是一家大数据分析公司。C,第三种是基于思维的公司。皮特·华登(PeteWarden),Jetpac的联合创始人,就是通过想法获得价值的一个例子。Jetpac通过用户分享到网上的旅行照片来为人们推荐下次旅行的目的地。对于某些公司来说,数据和技能并不是成功的关键。让这些公司脱颖而出的是其创始人和员工的创新思维,他们有怎样挖掘数据的新价值的独特想法。到目前为止,前两种因素一直备受关注,因为在现今世界,技能依然欠缺,而数据则非常之多。近年来,一种新的职业出现了,那就是“数据科学家”。数据科学家是统计学家、软件程序员、图形设计师与作家的结合体。与通过显微镜发现事物不同,数据科学家通过探寻数据库来得到新的发现。全球知名咨询管理公司麦肯锡,就曾极端地预测数据科学家是当今和未来稀缺的资源。如今的数据科学家们也喜欢用这个预测来提升自己的地位和工资水平。);
2.4,大数据应用案例(知道“是什么”就已经足够,不必非要弄清楚“为什么”。大数据的相关性将人们指向了比探讨因果关系更有前景的领域。这些相关性能让我们节省机票钱和预测流感爆发,并知道在一个资源有限的世界中应该检查哪些沙井盖和过度拥挤的建筑物。它可以帮助健康保险公司不做体检就能决定保险覆盖面,并降低提醒病人服药的成本。通过大数据的相关性,语言可以得到翻译,汽车可以在预测的基础上自行驾驶。沃尔玛可以了解飓风前应在门店准备哪种口味的蛋挞。);
2.5,大数据的负面影响(大数据同时也给我们带来了巨大的风险。它使得目前用以保护隐私的法律手段和核心技术失去了效果。无论大数据如何威胁到隐私保护,最让人们头疼的都是行为倾向问题。大数据预测的准确性越来越高,它能够预测行为的发生,在人们犯错之前,提前惩处。因为预测的结果几乎不可反驳,人们也就无法为自己开脱。但这种基于预测得出的惩罚不仅违背自由意志的原则,同时也否定了人们会突然改变选择的可能性。);
2.6,真理就是没有真理,人类是大数据的主人。我的意思是,人类可以无限接近真理,也只能无限接近。(“可解释性”正如在人工智能界所称的一样,对于不仅想知道“是什么”更想知道“为什么”的人类来说非常重要。大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。释放大数据的洞察力能够预见未来,提升效率,这将是大数据的价值和未来。我们的世界观正受到相关性优势的挑战。拥有知识曾意味着掌握过去,大数据可以帮助我们预测未来。让数据说话,当数据说话时会发生什么。大数据是一种资源,也是一种工具。它告知信息但不解释信息。它指导人们去理解,但有时也会引起误解,这取决于是否被正确使用。大数据的力量是那么耀眼,我们必须避免被它的光芒诱惑,并善于发现它固有的瑕疵。人们总是受到现有测量和认知工具的局限。我们明天使用的工具很可能比今天的强大数倍甚至上千倍,我们现在所拥有的知识较之明天可能就显得微不足道了。我们能收集和处理的数据只是世界上极其微小的一部分。这些信息不过是现实的投影——柏拉图洞穴上的阴影罢了。因为我们无法获得完美的信息,所以做出的预测本身就不可靠。但这也不代表预测就一定是错的,只是永远不能做到完善。这也并未否定大数据的判断,而只是让大数据发挥出了应有的作用。大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。这也提醒我们在使用这个工具的时候,应当怀有谦恭之心,铭记人性之本。)
最后推荐看看浙江大学的《大数据时代》的思维导图点击这里查看《大数据时代》的思维导图