这可能是我读书最快的一次了,用了10天时间读完一本书,当然,这本书本身也是通俗易懂。
接下来,我就按照自己的记忆和理解来记录一下对这本书的感受。
1 不再是样本,而是总体
以前的数据量不多,我们总是把样本数据做更好的分析,以求更为精确地推测出总体的情况。现在好像不需要了,因为数据量很大,达到几乎等于“总体”了,而且通过各种技术手段,我们还可以快速准确地处理实时大量的数据。
因此,这第一个改变就是:“样本”=“总体”。
2 不是因果关系,而是相关关系
大数据虽然可以给出一些准确的预测,但它到底还只是一个工具,并不是算命的“卦盘”。数据的量变大,进而引发了质变,也让我们获得了许多以前不曾意识到的“相关关系”,比如飓风的到来蛋挞的销售量会变好,啤酒和尿布应该摆在一起等等。这些简单的例子可以很好解释为什么,但是还有更多的“为什么”是大数据无法解释的,它给出的只是相关关系,而不是因果关系。
也许我们未来根本不需要知道为什么,只需要知道是什么,怎么做就好。毕竟,人类从古至今,一直都是这么发展过来的,一开始有很多事情理解不了,不过没关系,不影响使用就行。比如威尼斯商人在制作玻璃的时候,关于原料的配比可能并不知道背后的化学方程式,但是没关系,知道怎么做,做得出来透明度高的玻璃才是“王道”。
3 把一切东西数据化
自从计算机和互联网的普及,人类的社会生活发展,从未如此迅速。信息时代给了我们更快的发展,更畅通的沟通,而大数据时代的来临,给我们的将会是效率的提高,以及无所不在的数据化。
我们的生活以及充满了数据化,身体指标,运动指标,工资及业绩情况,购物信息等等,统统都是可以量化的数据。
是的,我们的一切都可以数据化,进而用来存储,分析。连抽象的绘画艺术,也可以通过人工智能进行创作了。
4 数据的价值
数据本身充满了价值,马云说未来的数据就是生产资料,而且未来的数据量将是现在无法想象的。
且不说我们每天产生的信息量有多大,你就想想,未来的可穿戴设备会增加多少,这些设备天然地就是收集数据的。
而如何挖掘并且利用这些数据中的价值,才是更为关键的。谁拥有数据,谁就有了主动权,数据本身的价值,将会在下一轮发展中得到巨大的彰显,它就像是一个待开发的金矿。也许我们不能成为拥有数据的个人,但是我们可以做利用数据的人啊,这个工作的价值总还是在的吧。
5 风险
大数据,人工智能只是工具而已,而工具的作用在于提升效率,改善生产。但是新工具的诞生势必会带来新的风险,或者引发一些问题。
比如我们的隐私可能就会因为各种公司对数据的采集,进而暴露。这种情况比比皆是,Google的街景地图暴露了一些富豪的豪宅,一些小众群体的人们也会不经意的被人发现他们不想让人知道的隐私等等。
我们形影不离的手机,就是一个暴露我们隐私的“利器”。试问现在一个人要是手机丢了,得有多麻烦,银行卡,各种账号密码,照片隐私等等。
还有街上到处都有的摄像头,其实也是在保护我们的同时,暴露了隐私,因为摄像头可能被“黑”。还有家里的摄像头,也是会被各种人利用的东西,昨天居然看到,家里的监控摄像头数据被人倒卖的新闻。
大数据足够准确,但是它的使用限制条件也很多,输入不足,偏差等等,都会造成结果的偏差,甚至背离真实。
目前的大数据可以解决一些问题,但是并不能解决大部分的问题,而且由于大数据的可预测功能,会导致法律上出现矛盾。
比如,警察局通过大数据系统预测到某人将要实施一起谋杀,于是马上赶到现场阻止,确实是阻止了,但是嫌疑人并没有犯案,这就没有证据。虽然可能在之后的某个时间点他会犯案,但是事实上这件事并没有发生,又该如何定罪呢?
不仅如此,人们做选择和判断的自由会被剥夺。也许未来每个人都会有一个电子助手,照顾你的日常起居,工作安排,它是个机器人,也许比你自己还了解自己。通过先进的科技手段,它能够准确告诉你今天的食物营养搭配是怎样的,你生病后应该如何配药来实施精准医疗,甚至它还能告诉你你会选择哪件出门要穿的衣服。
这些看似好像是方便了我们,但是你有没有想过,如果真是这样,那么我们人类还有自由意志了吗?如果每件事都有一个“先知”来告诉我们,那么我们人活着的意义又是什么?
即使存在一些无法解决的问题,我相信新工具的诞生总是会将人类引导进入更好的未来,这需要我们人类的智慧,更需要我们的勇气。