书中对大数据做了详尽的介绍,让我对大数据有了更深的了解,原来大数据是这么回事呀。现在的“大数据”全在于发现和理解信息内容及信息与信息之间的关系,让数据“说话”,在数字化时代,数据处理变得更加容易、更加快速,人们能够在瞬间处理成千上万的数据。
这些与三大重大的思维转变有关,这三大转变是相互联系和相互作用的:1、要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本。2、我们乐与接受数据的纷繁复杂,而不再追求精确性。3、我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。对“小数据”而言,最基本、最重要的要求就是减少错误,保证质量。因为收集的信息比较少,所以必须确保纪录下来的数据尽量精确。所以传统的样本分析师们很难容忍错误数据的存在,而在大数据时代要求我们重新审视精确性的优势,当掌握大量新型数据时,精确性就不那么重要了,同样可以掌握事情的发展趋势,并接受数据的不精确和不完美,也能更好地进行预测,更好地理解这个世界。
马修.方丹.莫里是一名很有前途的美国海军军官,在一次任务时大腿受伤,无法在海上工作,把他安排到了办公室,任命他为图表和仪器厂的负责人,在这期间,在库房找到的以前海军上尉写的航海日志,将其中的信息绘制出一张全新的航海图,帮助商人节省了一大笔钱,因为航海路程减少了三分之一左右,现在也孕育出大批的公司,像Facebook、Twitter、DataSift、Gnip、谷歌、亚马逊等等。
互联网的出现让监视变得更容易、成本更低廉也更有用处,不只是政府在暗中监视大家,亚马逊监视我们的购物习惯,谷歌监视着我们的网页浏览习惯,Twitter窃听了我们心中的“TA”,Facebook似乎什么都知道,包括我们的社交关系网,我们的隐私受到了威胁,大数据时代是否会加深这种威胁呢?如果把罪犯的定罪权放在数据手上,借以表达我们对数据和分析结果的崇尚,这实际上是一种滥用,运用不当可能会变成权贵用来镇压民众的工具,轻则伤害顾客和员工的利益,重则损害公民的人身安全。而这些必须从管理上变革,个人隐私保护从个人许可到数据使用者承担责任,个人动因与预测分析,击碎黑盒子,大数据算法师的崛起,反数据垄断大亨。应对大数据的汹涌来袭,我们没有万无一失的方法,必须建立规范自身的新准则,大数据能帮助我们更好的进行已有的工作,并处理全新的事物,但它不是魔术棒,我们能收集和处理的数据只是世界上极其微小的一部分,因为我们无法获得完美的信息,所以做出的预测本身就不可靠,但这也不代表预测就一定是错的,只是永远不能做到完善,大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。