Avatar notebook default
10篇文章 · 10165字 · 2人关注
  • Hive严格模式

    定义:防止用户执行那些可能产生意想不到的不好的效果的查询。即某些查询在严格模式下无法执行。 通过设置hive.mapred.mode = str...

  • Hive什么情况下可以避免进行MapReduce?

    hive 0.10.0为了执行效率考虑,简单的查询,就是只是select,不带count,sum,group by这样的,都不走map/redu...

  • Hive基本操作

    参考:hive 表的常用操作Hive基本操作 1 Thrift Server Thrift 支持多种语言之间的RPC方式的通信;Thrift为服...

  • Resize,w 360,h 240
    Hive体系架构

    参考:Hive: 基于 Hadoop 的数据仓库工具hive体系结构和执行流程 1、Hive产生背景 MapReduce编程的不便性 HDFS上...

  • Resize,w 360,h 240
    Hive中的内部表以及外部表

    Hive中的Managed Table以及External Table 原文:Hive中的Managed Table以及External Tab...

  • 数据分析概念和总结

    参考:什么是数据分析? 总结: 决策=数据+分析 数据分析的框架:明确分析目标、数据收集、数据清理、数据分析、数据报告、执行与反馈 数据分析与数...

  • Resize,w 360,h 240
    Hive产生的数据倾斜问题

    总结: 一:key分布不均匀1)key为null或异常值 对key进行打散通过rand函数将为null的值分散到不同的值上;对异常值赋一个随机值...

  • Resize,w 360,h 240
    Hive的优化问题

    总结: 一:key分布不均匀1)key为null或异常值 对key进行打散通过rand函数将为null的值分散到不同的值上;对异常值赋一个随机值...

  • Resize,w 360,h 240
    数据仓库概念和物理模型

    总结: 数据库是面向事务的设计,数据仓库是面向主题设计的。数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。数据库设计是尽量避免冗余,一...

文集作者