本科毕业论文写的是风力发电,作为一种安全清洁的可再生能源,虽然并网会给电网带来较大压力,但随着智能电网的普及,风力发电前景喜人。与风力资源类似,数据也是可再生的,而且与对风力资源的利用暂时只局限在发电领域不同,数据可以被称作是可再生的可再生资源。两个可再生并非笔误,而是源自其价值的多样化,对数据利用方式的创新,带来的,是源源不断的数据价值。
数据冰山,更需要仔细勘探,太远,会看不清,太近,会迷失方向,如果不小心撞上,那恐怕只能在数据之海里沉没了。所幸,在大数据思维的指引下,在数据的首要价值被挖掘后,潜在价值也持续不断被释放。
三种创新让我们得以初探冰山全貌。
数据创新1:数据的再利用
数据再利用的前提是收集或控制数据集尤其是大型数据集。有些机构如谷歌、如亚马逊,早早地开启了他们的数据再利用之旅,谷歌基于关键词搜索整理了一个版本的搜索词分析,并公开供人们查询,如实时经济指标以及旅游部门的业务预报服务;而亚马逊则一直致力于让数据的价值再大一点,通过早期为AOL电子商务网站提供后台技术服务的合作,让亚马逊掌握了用户的数据,包括他们在看什么、买什么,进一步帮助亚马逊提高推荐引擎性能。
与这些线上企业对数据利用的敏感度不同,一些线下运作的传统企业,也许还在信息喷泉上安睡。有些数据被收集、被保存,但也把数据带入了坟墓,暂不能见天日。但当他们嗅到了数据所带来的机会后,如一家知名的物流企业,针对其掌握的全球出货信息,成立专门部门,以商业和经济预测的形式出售汇总数据,创造了谷歌搜索查询业务的一个线下版本。
数据创新2:重组数据
还记得那个将某个地区的交通事故发生情况与犯罪发生情况映射到一张地图上的例子么,这就是数据重组,很多时候,1+1>2的效果一次又一次地在证明其强大魔力。其实,两个或者更多个大数据的相加,是更大的大数据,关键在于怎么相加。丹麦癌症协会曾就手机是否增加致癌率这个命题进行研究,通过将1990年至2007年间拥有手机用户的信息和该国所有癌症患者的信息这两个数据集结合后,得出了没有发现使用移动电话和癌症风险增加之间存在任何关系的结论。这就是一个数据与数据相加的实例,虽然未能形成轰动的效果,但至少也能让人们更加放心的使用移动电话了,也为我们提示了大数据运用的更多可能性。
数据创新3:可扩展数据
一个数据集并不会只有一种用途,就如美的发现需要一双发现美的眼睛一样,数据的用途也需要一双发现数据用途的眼睛。零售商店内的监控摄像头,不仅可以用来认出商店扒手,还能跟踪在商店里购物的客户流和他们停留的位置,利用这些信息,零售商可以设计店面的最佳布局并判断营销活动的有效性,正如那句话所说,无心插柳柳成荫。
数据利用的其他可能,还有数据的折旧值、数据废气、开放数据等。其中,开放数据最吸引人眼球,这也是各国政府现在正在努力推进的,其主旨是通过多元主体的参与,唤醒沉睡的数据,虽然真正实施起来,并不是那么容易,但这,必然是大势所趋,方向已经确定,路途的曲折蜿蜒,不过是为了更好地前进。