240 投稿
收录了14篇文章 · 34人关注
  • 解决MismatchedTokenException(26!=136),at org.antlr.runtime.BaseRecognizer.recoverFromMismatchedToke...

    产生此问题的原因:编码问题解决方式一:改变数据的编码 结局方式二:若还不能以方式一解决,则重新创建的数据库metastore[自己先创建,不自动...

  • Hive解析json数组

    在使用Hive搭建数据仓库,处理数据时,同传统数仓的结构化数据不同,我们经常会遇到一些非结构化的数据,json格式的字符串就是常见的一种类型。对...

  • Hive调优

    本文种记录的大多是开源版本hive调优方式 我也会补充TDH集群Inceptor的优化方式 面试必备技能-HiveSQL优化 Hive SQL基...

  • Hive Sql优化记录

    日常检查ETLjob时发现一段sql采用hive on mr执行比hive on spark要快70%,与正常的认知正好相反,所以对该sql进行...

  • 数据仓库之建设

    背景篇 目前所在项目中,人员配置:项目经理(4)业务分析师报表开发工程师(2,4)etl工程师大数据开发工程师(4)人员压缩可参考括号内 分析篇...

  • Hive 差集交集并集

    1. 交集: select id from t1 join select id from t2 2. 并集 select id from t1 ...

  • Hive时间转换

    Hive时间转换 用到hive时间转换总结如下: 转换成小时 req_time是 "2016-11-29 17:47:59"要转换成小时"201...

  • Hive分区表:发现指定时间范围内数据有更新的分区

    使用场景 需要查找最近修改时间在指定范围内的hive表或者hive表的相关分区,代码如下:

  • Resize,w 360,h 240
    Lateral View和Explode用法简介

    一、Explode用法 hive wiki对于expolde的解释如下: explode() takes in an array (or a m...

    0.1 gofun 0 2
  • Hive-索引

    简介 Hive从0.7.0版本开始加入了索引,目的是提高Hive表指定列的查询速度。没有索引的时候,Hive在执行查询时需要加载整个表或者整个分...

专题公告

深入浅出的学hive,欢迎学习和投稿