从概念到问题再到应用,全面了解数据基因系统

2017年2月15日国脉发布了数据基因系统,旨在为政府建立数据管理体系提供便捷、可靠的工具支撑,帮助政府梳理数据资产清单、统一数据口径、建立数据标准、定位数据资源、分析资源关系、设计管理模型,从而更加有效的提升数据资产管理能级,实现数据驱动服务创新。

那么该如何理解数据基因?数据基因系统能解决哪些问题?价值究竟在哪里?本文从概念到问题再到实际应用场景,为大家详细介绍数据基因系统。

如何理解数据基因?

DIKW体系认为数据(Data)、信息(Information)、知识(Knowledge)和智慧(Wisdom)之间是层层递进的关系,从数据里挖到信息,从信息里得到知识,从知识里获取智慧。

在这个金字塔体系中,我们认为数据基因位于数据层和信息层,它赋予数据特定的含义,与数据一起构成了我们认知信息的基础

图1.数据基因在DIKW体系中的位置

实际上,我们认为数据基因系统是管理系统的系统,从业务出发,到应用系统、再到数据库、数据表,甚至到驱动服务,是数据大管家,实现从管网络、系统到管数据的跃迁。

解决哪些问题?

缺乏完整、统一的信息资源体系

目前各个地方开展信息资源目录体系建设工作,往往存在部门提供什么梳理什么,部门中很少存在某个人员完全掌握该部门信息资源,需不同科室之间进行调研、梳理,通常存在不清楚自己部门到底有哪些、不清楚其他部门有哪些信息资源,缺乏完整、统一的信息资源体系。

应用系统建设分散、数据关系混杂

各级地方政府和部门在开展信息化建设时往往各自为政,各自建设应用系统,没有构建统一的基础信息平台,形成了许多信息孤岛。由于缺乏统一的信息系统建设标准,造成各个信息系统的数据口径不一致,系统、数据之间的关系不清楚,使整个信息系统构架中数据的采集、存储、交换、加工、利用等各部分间不能循环互动,系统中的数据无法有效共享,造成了信息资源利用率低。

数据不一致、不准确

在以数据交换共享时,遇到的最大问题就是数据不一致和不准确,举几个实际例子:

1、某系统个人信息的姓名是20位,另一系统的姓名是30位,在数据同步的时候就会出现无法同步的问题;

2、一个系统数字0代表男、数字1代码女、数字2是未知,另一个系统字母M代表男、字母F代码女,这是一个代码不一致问题;

3、在不同系统中存在“机构名称”、“单位名称”、“公司名称”,不知道是否为同一个含义;

4、如果是同一个企业,某个系统里面编码是0001,另一个系统里是0002,其实代表的是同一条数据。

数据标准管理框架缺失

目前很多部门的应用系统一般是建立在数据仓库或基础数据库基础上,数据积累已有一定的规模。但由于缺乏统一的数据标准规范,同时缺乏数据基于业务的理解,导致新建或改造升级的系统建设缺乏标准先行的原则,难以实现数据标准“循序渐进、不断完善”的要求。

数据基因系统的价值在哪里?

快速建立信息资源体系

数据基因系统对比筛选出城市核心业务部门的核心业务的信息资源建立整个信息资源体系建设的模板库,通过模板库城市各单位可直接查阅相关数据元、信息资源模板,以直接沿用或是自定义修改的方式对模板进行选择性的编目,达到各部门政务信息资源快速梳理、信息资源体系快速架构的目标。

图2.模板设计

建立数据资产地图

数据基因系统通过对城市机房、服务器、应用系统、数据库等数据资产的梳理,建立部门数据资产清单,通过系统建立之间的相互关系,理清楚系统与系统之间、系统与数据库、表之间、数据与数据之间的关系,实现数据—数据表—数据库—应用系统—服务器—机房(云)的关系展现,建立部门数据资产地图。

图3.资源关系分析

辅助数据质量问题分析

通过数据基因系统数据元池的建立,梳理分析各部门、各应用系统中出现的相同的、近义的数据字段,通过分析其频率、数据定义及数据相互之间关系(数据来源、数据流向等),了解各应用系统之间数据标准体系的建设情况,辅助数据质量问题分析。

图4.数据元关系分析

辅助数据标准的落地

通过对各部门、各应用系统数据元池的清洗比对,筛选出各部门共性、关键的主数据,建立涉及核心数据的标准字段池,对字段的命名、格式、长度等属性进行规范,依托标准数据元池进行信息资源信息项的编目,严格控制新增字段,实现共性数据元的统一标准规范,推动数据规范的落地执行,建立数据模型标准化定义映射,推进数据标准化规范的落地实施。

图5.数据元池管理

辅助系统开发运维

数据基因系统提供相关数据库、基础库、主题的模型设计功能,实现不同系统建设需求、应用场景下,通过标准数据元池、信息资源的组合构建应用模型,围绕构建的模型可以实现快速构建应用系统数据表结构设计。当各部门新增需求或者系统上线维护后提出修改时,可通过数据基因系统查看现有系统的结构,设计新的数据结构或修改数据结构来辅助系统开发运维。

图6.模型设计服务

总结

目前随着政务大数据的发展,政府对数据标准化管理的需求正日益增加,未来数据基因系统将是连接业务、数据、系统与服务的核心基础设施,可扩展的数据基因系统将能够产生更多更有价值的应用场景。

本文为国脉物联网原创文章,转载请注明来源!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容