世界的本质是什么?道说:是人间;佛说:是六道之一;上帝说,是天堂和地域之间的战场;哲学说:是无穷的辩证迷雾;物理说:是基本粒子堆砌起来的聚合体;人文说;是时间的积累。现在,又有了新的答案:是数据。站在不同的角度看待,往往会有不同的解答,因为世界是一个庞大的复杂体,横看成岭侧成峰。维克多·迈尔-舍恩伯格教授的《大数据时代》,就向我们证明了世界的又一种形态——数据。
我们生活在一个充满数据的时代,而计算机和网络的发展让数据的存储、传输以及处理得到了巨大的飞跃。面对海量的数据,你能看到什么?数字?信息?还是一片混沌?在此之前,我只知道互联网会深刻的改变和影响我们的生活,而不知道互联网的价值是通过数据的交互来体现。现在。在海量的数据中,是源源不断的价值,是对未来神秘精确的预言,是世界的一种形式。
我们已经进入大数据时代,以前所未有的方式,通过对海量数据进行分析获得具有巨大价值的产品和服务,或深刻的洞见。大数据告诫我们“是什么”而不是“为什么”,在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。作者指出了大数据时代处理数据理念上的三大转变:1.要全体不要抽样 2.要效率不要绝对精确 3.要相关不要因果。抽样不是一种必要的方法,而是受限于技术的妥协,但随着网络和计算机的发展,“样本=全体”已经成为可能,这样庞大的数据样本更加丰富也更能还原事物的本质。另外,以前对于数据处理执迷于精确性,是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户。然而错误并不是大数据固有的特性,而是一个需要我们去处理的现实问题,并且可能长期存在。对于大数据看中相关关系而不是因果关系,作者给了详细的说明。相比较于因果关系,相关关系分析更加准确、更快,而且不受偏见的影响,因为信息量的变化会导致信息形态的变化——量变引发了质变。比如通过监听微博,可以预测一部电影的成败;销售商利用信息可以设计店面的最佳布局并判断营销活动的有效性;通过大数据,语言可以得到翻译,汽车可以在预测的基础上自行驾驶,亚马逊可以推荐你喜欢的书或者网易音乐推荐你喜欢的歌,这些推荐都往往能打动我们。我们只知道是什么就行,不需要明了为什么。作者认为,如果凡事都有因果的话,那我们就没有决定任何事物的自由了。如果说我们做的每一个决定或者每一个想法都是其他事情的结果,而这个结果又是其他原因导致的,以此循环往复,那么就不存在认得自由意志这一说了。
大数据是一场思维革命,更是一场商业革命。如今,数据已经成为一种商业资本,一项重要的经济投入,可以创造新的经济利益。事实上,一旦思维转变过来,数据就能巧妙地用来激发新产品和新兴服务。大数据不但是我们获得认知,创造新的价值的源泉,大数据还是改变市场、组织机构,以及政府与公民关系的方法。
数据的价值体现在哪?它能通过一定的数学算法,为人们揭示真相,获得方法解决的途径以及预测未来。数据的真实价值就像漂浮在海洋上的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。现如今,数据成为衡量一个公司实力的重要条件,拥有数据以及有对数据处理的能力和运用数据价值的思维是许多公司立于不败之地的法宝。想象如果谷歌、微软、亚马逊、百度等等网络巨头公司如果没有了所拥有的巨大的数据,那这些公司不知还能不能生存。根据所提供价值的不同来源,分别出现了三种大数据公司。这三种来源是指:1.数据本身 2.技能 3.思维。往往巨头公司都占有两种或者三种来源。
然而,大数据时代的来临,也将面临着许多的问题,就像一开始互联网到来时出现问题一样。作者冷静描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。大数据需要人们重新讨论决策、命运和正义的性质,我们的世界观正受到相关性优势的挑战。为此,作者提出了许多可行的措施,比如责任从民众转移到数据使用者。三大原则:公开原则,必须进行预测分析的算法系统。公正原则,具备有第三方专家公正的可靠有效的算法系统。可反驳原则,明确提出个人可以对其预测进行反驳的具体方式。最重要的是,确保个人动因能防范“数据独裁”的危害。
《大数据时代》向我们表明,拥有知识曾意味着掌握过去,现在更意味着预测未来。
2015/05/06 19:51