240 投稿
收录了32篇文章 · 169人关注
  • Resize,w 360,h 240
    数据库 VS 数据仓库

    数据库和数据仓库这几个字看起来都差不多,不就多个仓字嘛,又不是多了苍老师? 从本质上来说,数据库和数据仓库都是数据的集合。没什么不同。 但是它们...

  • Hive解析json数组

    在使用Hive搭建数据仓库,处理数据时,同传统数仓的结构化数据不同,我们经常会遇到一些非结构化的数据,json格式的字符串就是常见的一种类型。对...

  • Resize,w 360,h 240
    数据仓库模型分层

    PS:无法复制表格样式,只能截图了

  • 大数据数仓建设性能优化方案

    大数据数仓的性能优化主要围绕以下四个方面: 调度优化 模型优化 同步任务优化 计算任务优化下面将对着四方面的优化方法进行具体阐述。 调度优化 在...

  • Resize,w 360,h 240
    数据仓库-Hive

    数据仓库(Data Warehouse ) 1.1 基本概念 数据仓库的目的是构建面向分析的集成化的数据环境, 为企业提供决策支持 (Decis...

  • Resize,w 360,h 240
    迟到的Kudu设计要点面面观(之更加迟到的后篇)

    前篇传送门:https://www.jianshu.com/p/5ffd8730aad8 目录 Prologue(见前篇) Kudu的初衷(见前...

  • Resize,w 360,h 240
    漫谈数据库中的join

    Prologue join是我们这些整天与数据打交道的人绕不开的一个词,不管是在传统的关系型数据库,还是在大数据领域的数据仓库/数据湖中,joi...

  • Resize,w 360,h 240
    迟到的Kudu设计要点面面观(前篇)

    后篇传送门:https://www.jianshu.com/p/24bdc6f62e84 目录 Prologue Kudu的初衷 集群架构与共识...

  • Resize,w 360,h 240
    银行数据仓库体系实践(4)--数据抽取和加载

    1、ETL和ELT ETL是Extract、Transfrom、Load即抽取、转换、加载三个英文单词首字母的集合: E:抽取,从源系统(Sou...

    2.0 acumen_leo 0 11 1
  • 数据仓库面试问题汇总

    毕业后做了7年java应用开发,主要在一家传统软件公司做BI相关的东西。因为主要是写业务代码,大公司都有自己的技术平台,所以java技术也...

    0.6 Ryan_Fn 3 13

专题公告

大数据数据仓库