随着新兴信息技术的发展及广泛应用,人类社会已经进入数据爆发式增长时代,数据治理能力正在成为组织新优势,大数据的价值愈发凸现。2015年,国务院发布《促进大数据发展行动纲要》,标志着大数据在我国的发展与应用上升到国家战略层面。2016年,《政务信息资源共享管理暂行办法》出台,明确共享开放是原则,非共享开放是例外。在国家政策的推动下,全国卷起一股大数据应用热潮,各地纷纷建设政务大数据平台,各种数据中心雨后春笋般的急剧发展。然而,在看似前景大好背后,许多政府还停留在赶时髦或炒概念阶段,一味“建机房、上设备、堆数据”,缺乏基础工作和统筹工作、顶层设计工作,数据“少”、“差”、“死”、“乱”等现象不断发生。
那么如何改善这种现象,快速提升我国政务大数据的能力和水平?从信息生命周期的角度,我们要保证数据来源清晰、传播无阻、使用无碍、维护简单。这个过程中,数据基因系统起到了关键性的作用。
>>>>来源清晰
传统的信息系统,仅为满足特定功能而生,数据结构差异性大,大量数据存放于历史遗留应用中,委办局间碎片化、零散化、低效率的数据交互和分析普遍存在,导致政府数据来源极为复杂,不可直接使用。而数据基因系统,可通过对城市机房、服务器、应用系统、数据库等数据资产的梳理,建立部门数据资产清单,通过系统建立之间的相互关系,理清楚系统与系统之间、系统与数据库、表之间、数据与数据之间的关系,实现数据—数据表—数据库—应用系统—服务器—机房(云)的关系展现,确保每个信息来源清晰。
>>>>传输无阻
信息从一个系统传输到另外一个系统的前提是两个系统拥有相同标准的数据元。而目前,政府通常的做法是建设一个交换共享平台,通过这个平台使不同系统的数据得以共享和交换,然而这需要花费大量的时间和资金,比如需要开发系统接口,有多少系统,就要多少接口,对于新建的系统也一样。事实上,政府不同部门每年都需要建立大量的信息系统,因此需要不断开发接口来进行共享。那么是不是可以直接做一套标准,让后续系统都按照这个标准设置数据,如此系统间便可实现直接交换?答案是肯定的,数据基因系统最大的特点是通过对各部门、各应用系统数据元池的清洗比对,筛选出各部门共性、关键的主数据,建立涉及核心数据的标准字段池,对字段的命名、格式、长度等属性进行规范。如果新增的系统也是按照这套标准开发,则无需开发新的接口,可直接与交换共享平台进行无缝对接,省时省力。
>>>>使用无碍
使用是指在信息到达最终用户手中后对数据进行的分析、统计和以其为基础进行管理和决策。“碍”,一方面是体制机制的原因,一方面是数据本身的原因,比如数据不能用、不好用等。政务大数据应用牵扯到很多关联部门,存在着利益主体及相关者,如果一味建数据中心、数据平台,忽视数据的信息规则,导致许多部门有理由“扯皮”或“推脱”,不愿将数据开放共享,数据中心和数据平台数据严重缺失或数据复用率极其低下。因此,为确保数据使用无碍,亟需建立一个健壮的信息体系,使数据活化,各部门用起来顺心和放心。借助数据基因系统,可建立有序的信息规则,从网络、系统、数据库、制度、标准等多方面保障信息最大程度的共享与开放,从根本和底层上解决了数据发展难题,并有助于信息体系的成长发展。此外,数据基因系统还拥有强大的大数据分析能力,不仅可以直观显示各部门信息资源、数据元数量统计情况,各部门信息资源、数据元共享、开放情况,还能辅助数据质量建设,通过关联分析,了解各应用系统之间数据标准体系的建设情况。
>>>>维护简单
维护是指对数据的管理,这种管理包括存放、读取、传输、拷贝、备份等。如何让数据维护简单,一是统性能卓越,本身不易出错;二是操作方便,业务人员能够迅速处理各项需求。国脉互联董事长、浙江大学客座教授杨冰之最近有个新观点:数据与系统分离是未来数据体系的主要方向。如何理解呢,一般我们新建一个系统时,需要新建一个数据库做支撑,那么在维护时,需要对这个数据库进行维护,如果系统功能非常复杂,维护起来是相当吃力的。而通过数据基因系统,未来的系统不需要再新建一个数据库,而是直接从数据基因系统数据库中抽取所需要的数据,如果新系统的数据基因系统没有,则可在基因系统中增加相应的数据,即数据与系统分离。这样做的好处,一个是确保所有数据具有稳定性、统一性、可复制性、可剪辑性,保障内部信息的规则的一致性;二是极大降低了维护成本,新系统的开发运维只需要关注如何创新应用,不再需要考虑数据如何维护;三是可满足多部门、多用户、跨平台的数据查询、订阅、共享等需求,统一调度与处理。
随着政务大数据的发展,各地政府亟需进行统一的数据标准和规划,解决因条块分割问题严重而形成的“数据孤岛”、“信息烟囱”,真正实现各地、各系统政务数据的互联互通、共享共用、开放运营和融合应用。
作者:国脉研究员陈乐燕