240 发简信
IP属地:河北
  • Resize,w 360,h 240
    数据仓库指北

    一、 Q&A Q1:什么是维度?维就可以相当于角度,当说按什么维度看数据就是你想从什么角度分析数据。Q2:什么是次留用户,7日留存?次留用户指的...

  • Resize,w 360,h 240
    hive积累大全

    此篇内容:hive自定义函数UDF、UDTF,压缩存储方式,hive优化、hive实际编程基本涵盖了hive基础及常用场景,输出这篇单纯是为了忘...

  • 「Hive进阶篇」HQL 高级巧用

    更多精彩好文首发,尽在公众号《大数据阶梯之路》我是Akin,给大家整理了一些hive函数的高级用法,作为Hive进阶系列文章第四篇,其中有些SQ...

  • 数仓工程师的技术路线篇

    更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据仓库工程师是什么 首先,我要声明一点,数仓工程师不能有一个惯性思维,那便是把自己当成一个...

  • Resize,w 360,h 240
    「Hive进阶篇」万字长文超详述hive企业级优化

    肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优化详细PDF文档,有需要可关注...

  • Resize,w 360,h 240
    「数据湖篇」一文带你深入理解数据湖

    更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、数据湖是什么 数据湖相当于一个汇集着来自各个异构数据源的原生态数据,不经过加工清洗数据,数据...

  • 大数据领域入门引导篇

    更多精彩好文,尽在微信公众号《大数据阶梯之路》 一、前言 大家好,我是Akin,考虑写下这篇文章的时候我已在互联网大数据领域工作了几年,主要是给...

  • 「Hive进阶篇」详解存储格式及压缩方式

    一、前言 hive优化除了有hql语句逻辑优化,hql参数调优等等,还有一个不起眼的细节容易被忽视掉,那便是hive数仓模型表的存储格式和压缩方...

  • Resize,w 360,h 240
    「数仓建设」主题域划分

    大家好,本篇聊一下数仓建设,讲一下面试常遇到的主题域与主题划分,更多精彩文章优先从微信公众号《大数据阶梯之路》首发,欢迎关注,公众号回复:大数据...

    3.3 5395 0 11