数据治理101.1

数据治理的意义

在过去的几年中,随着中台战略被阿里提出。所有的公司都相应的紧跟步伐,建立了各种中台。而其中数据中台是最为津津乐道,也是被放在最核心的中台建设。在我看来数据中台并非对应着新的数据技术,而是一改之前以技术为主要推动力的数据管理方式,转而改为由业务赋能的为主要推动力的管理方式。是一个从重视数据收集与计算到重视数据应用的转变。
随着越来越多的数据被存储下来,管理数据的成本变得越来越高,如何高效的使用这些数据,如何为自己的数据资产定价都是现在应用数据时所面临的难题。以此为出发点,对现有的大数据工具做一份整体的研究与分析。希望对于刚刚接触这个行业的人,有所裨益。

产业地图

产业地图.png

首先我们先来看看现在整体大数据技术的产品的版图。在之后的文章中,我们会对不同的产品进行测评与分析。由于笔者自身的理解有限,不足之处希望大家可以指正。大数据的技术发展至今,各个方面的开源工具已经趋于完善,并且随着新的技术的出现围绕新的技术而展开的升级换代也催生出了一系列的大型公司。在笔者看来,有三个原动力在推进这个方面的变革 :

  1. 云计算
    云计算的出现使得构建一个大数据的服务变得简单,同时由于维护一个分布式系统的难度,使得将大数据的服务托管于云服务上的选择变得越来越为主流。也正因为如此,云计算厂商不断推出自己的云服务来满足企业对于大数据的需求。这其中最为著名的便是AWS的S3的服务。一定程度上在AWS的使用场景里,几乎都会选择用S3来替代HDFS的存储。
  2. 大规模异构场景的出现
    自从Hadoop出现之后,新的计算与存储的项目便如雨后春笋般的崛起。比如用于搜索的Elasticsearch, OLAP场景的Greenplum, AWS的S3。而因为为了不同场景所建立的不同的项目,使得大部分现在大数据平台在存储与计算中都存在异构的问题。所以原来在RDBMS场景中需要的工具,又需要在新的异构场景下重新的实现一遍。最直接的例子就是基于SQL的一整套工具,比如Hive, Presto等。
  3. 人工智能的使用更加的频繁
    AI的广泛使用也催生了大数据工具的完善,因为绝大部分的算法任务都对于数据有着较强的依赖,尤其是在准备训练数据的时候。同时算法也紧密的结合在了现在新的ETL的过程当中,这就对于原有的数据开发工具也提出了新的改造的需求。

在这三方面的共同推动下,如今围绕大数据的工具已经越加趋于稳定。随着底层应用的稳定,以及越来越多的数据被收集,数据治理的问题被提到越来越高的位置。而数据中台的建设,也可以被理解为是数据治理的贯彻。数据治理需要配合公司自身的战略进行,同时也需要有技术的工具作为支持。当前数据治理的工具要么来自于商业公司,比如informatica, Oracle,要么来自于云服务商AWS, 阿里云等。对于大部分的小型公司来说,要么需要找到对于大数据产品非常熟悉的专家自己拼装一个数据治理系统,要么就需要与云服务商强绑定。所以笔者认为未来在这个版图中会继续崛起新的开源数据治理的方案。

功能对比

Screen Shot 2020-05-27 at 11.56.13 AM.png

对于现有的数据治理产品做一个梳理,我们可以得到上图所示的功能的对比。在之后的介绍中,我们会优先介绍数据治理包含的内容,之后再选取对应的技术与工具进行分析。因为很多数据治理的工具是商业产品,并不对外开放,因此我们会将更多的精力放在开源项目中。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343