工作一个半月了。因为工作原因,开始接触大数据方面的知识。以前对大数据领域完全没有涉足,有幸在第一份工作就可以涉及到一个新兴的领域还是很欣慰的。
用了两个星期零散的时间,将大数据时代这本书看完了,作为我步入大数据领域的思想指导指南。一开始以为这是一本专业技巧方向的书籍,拿到书的第一天就发现是一本偏向思想的书。网上对这本书的赞誉很高,我也就不花什么口舌去推荐了。能用这本书作为我的入门书籍觉得还是很荣幸的,毕竟思想决定了方向。
作者用了很多案例来解释大数据时代下数据的作用。整本书介绍了三个作者认为非常重要的大数据思想。
第一,样本=总体。什么是大数据?数据量很大就是大数据?上百T的数据?在消息匮乏的年代,人们总是随机抽样,用样本来代表总体,然而在大数据时代,样本便就是总体。第二,不是精准性而是混杂性。同理,在信息缺乏的时代,因为数据量来之不易并且稀少,我们应该尽最大可能的提高精准性。然而在大数据时代,很多数据的本身就是混杂的,不正确的。我们需要包容这些不“错误的”数据。第三,相关关系而不是因果关系。因果关系很难证明且非常复杂,通过对大数据的挖掘和分析,我们只要知道事物的相关关系就足矣。
随后便是大数据时代下社会的变革,商业的变革。企业通过对数据的二次分析,会发现意想不到的结果,并且一切都可以数据化,重要的是大数据思维。
最后,预测了一下大数据时代社会的缺点。因为数据的暴露,人的隐私越来越难以得到保护。因为大数据的分析,进行预测,从而对一件事情做了决定。那么问题就来了,人之所以为便是人类拥有选择的权利。若任何事物都被预测,人只要跟着预测结果做决定,那么便失去了数据的价值。这边是数据的滥用和错用。
大数据之路漫漫,引用一个名言。Everyone is talking big data, big data like teenage talk about sex.