什么是大数据?有研究报告将大数据定义为,由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处理与应用模式,通过数据的整合共享、交叉复用形成的智力资源和知识服务能力。
大数据涵盖数据从产生到最终被分析利用的各个环节,其中所涉及的相关技术都可以被称为大数据技术,而对数据施加影响的各方则共同构成了大数据产业链。大数据技术的意义在于对这些有意义的数据进行专业化处理,从海量数据中发掘出真正的价值。
据IDC发布的关于中国大数据技术和服务市场的首份报告《中国大数据技术与服务市场2012~2016年预测与分析》显示,该市场规模将会从2011年的7760万美元增长到2016年的6.17亿美元,未来5年的复合增长率达51.4%,市场规模增长近7倍。
当前,大数据在政府决策、交通、物流、金融、广告、电信、医疗和农业等领域的应用蓬勃发展。
作为大数据在互联网广告行业的应用实例,近期,智子云获得汉理资本宣布数千万人民币规模的投资,反映了资本市场对大数据应用领域的认可以及企业客户市场对营销技术服务的需求。除此之外,智子云在推出DSP技术输出、平台定制策略后,业务进展也是比较理想的,提出了“让每一家广告公司拥有自己的DSP”的口号,致力于为传统广告公司拓展新媒体营销提供技术驱动引擎,将复杂的技术和大数据处理能力平民化,普及化,让技术服务于业务。
对此,智子云CEO朱建秋博士表示:“大数据因为数据量巨大,并且持续不断,直接对大数据本身进行实时利用是很困难的。数据挖掘的作用是用算法将大数据变小,变得能实时利用。所谓的变小,就是从大数据中分析得出一些规律,专业的说法叫模型或者规则,再对模型或规则进行利用。举例来说,“买APPLE笔记本的人70%会买鼠标”是一条规则,那么对于买了APPLE笔记本还没买鼠标的人,就可以投放“鼠标”这个商品。这种智能的RTB广告效率就比其他形式的广告要高不少。从这个角度来说,在大数据和应用之间,数据挖掘是一个桥梁,通过数据挖掘能够获得关联规则、时间序列、预言模型、聚类、异常模式等等有价值的规律或者知识。当然,数据挖掘算法并不是一开始就能处理大数据,目前一些算法能够处理,也得益于分布架构和计算技术的进步,传统的数据挖掘要在MapReduce和云计算上跑通,并能增量更新模型,才能处理持续不断到达的大数据。”