240 投稿
收录了6篇文章 · 3人关注
  • 数据仓库之质量管理

    数据仓库,通过etl工具将多源数据进行集成,内部实现对业务数据的清洗、加工、模型、算法等,以实时或离线的方式对外提供数据服务,为部门或企业的决策...

  • Resize,w 360,h 240
    数仓建模 - 维度 vs 关系

    数据仓库模型建设 模型概念 维度建模 关系建模 建模实现对比 模型选择 Data Vault 简介 数据仓库模型建设 数据管理一直在演进,从早期...

  • Resize,w 360,h 240
    缓慢变化维 - 理论与实践

    介绍 概念 应用场景 处理方式 使用 存在的问题 实践应用 基础数据 处理方式a 处理方式b 优劣对比 总结 介绍 概念 ​ Slowly...

  • Resize,w 360,h 240
    离线数仓从0到1

    话聊建设数仓 ETL工具面临的问题 分层分层的出发点分层设计 模型建设为什么要建设模型怎么建设模型理清工作思路实施步骤建模方法及实施 规范建设临...

  • 我在hive上搭建数据仓库

    一般将hive作为大数据中离线数据的存储,并把hive作为构建数据仓库的环境。可我们也要了解一个事实,hive不支持行级操作,无法像RMDB那样...

  • kimball维度模型技术与指导

     数据建设,解决的目标就是从数据源头到数据价值实现的全链路工作,我们把这个链路比作有机蔬菜的商业化实现。那么,数据仓库建设就好比是这个商业化餐厅...

专题公告

源数据产生后,就需要将数据进行合理的组织和管理,通过提取、转换、重载的方式获取有效数据并进行二次建设。围绕着简单、清晰、扩展的目标,建设一个用户能够快速访问、高效获取的数据仓库。并基于此,为决策提供可视化的分析产品或关键指标