大数据从提出到现在,一路纷纷扬扬的,过一段时间就会有人提起,一有人提起,马上又被推到风口。
大数据,首先是这个数据足够大,越大越好,因为这个数据是给超级计算机来阅读、分析,而后根据我们设定的条件进行整理,并且整理出我们需要的简单的信息。一个简单的例子:有一个人想要查找20年前小学的某个同学,但是他手上仅有20年前拍摄的已经磨损厉害的一张陈旧集体照,这个时候他可以以这张照片为样板,从网上按图模糊索引,只要这照片在网上曾出现过,那么网络就会查到出处,这时,只要对该出处进行再一次索引,那么,他的搜索范围越来越小,搜索目标的准确度越来越精准。
我们现在用到的导航软件实际就是一次初级计算机对海量实时路况的精准分析后的做出的非常简单的语音信息,但是现在已经有更高一层级的应用是建立在这个初级运算的基础上,这就是自动驾驶,它建立在实时路况的基础上,再通过计算机对驾驶技术的仿生自学习达成。
大数据最本质的作用是概率统计学上的应用,简单的一个很有趣的例子,一个地方要调查外来四川籍务工人员的数量波动情况,他们不是进行地毯式排查,而是对大型农副产品批发市场、农贸市场里的辣椒的进销库存及价格进行分析,因为四川人无辣不欢,所以这个数据统计后的数字是可以作为粗略的低成本排查手法。
大数据的竞争在将来应该是更多的计算机算法、运算能力间的竞争,我们人类识别一个物体是靠感官加上认知,而以后的超级计算机识别东西只内容即可,好比,当我们输入‘狗’,计算机会把数据库中所有狗的图片给你显示出来,这个数量有几十万,但是再输人‘黑色萨摩耶’,那么出现的记录就只有大概几百了。
一堆没有处理的数据就像是一堆砖头,基本没什么用,把砖头砌墙还是盖楼就像对大数据的处理能力,处理后的信息就如同盖好的是何种类型的房子?就看细心的我们如何发掘。