240 发简信
Eqo
IP属地:浙江
  • 120
    Hive Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask

    hive insert 在非overwrite 插入数据时,且表中已经存在数据时 容易报以下错误 这时只需要加上这条设置即可 set hive.stats.column.au...

  • 120
    Hive3.x测试_null跟null 关联问题

    结论: hive当中null与null 无法进行关联 结果 NULL 没有关联上

  • 180
    Eqo ·

    select * from tmp.l_table a join tmp.r_table b on a.dt = b.dt and a.dt = '2021-11-09' and b.dt = '2021-11-09'

    -----执行计划
    spark.sql(" explain select * from tmp.l_table a join tmp.r_table b on a.dt = b.dt and a.dt = '2021-11-09' and b.dt = '2021-11-09' ").show(100,false)
    |== Physical Plan ==
    *(3) SortMergeJoin [dt#35], [dt#38], Inner
    :- *(1) Sort [dt#35 ASC NULLS FIRST], false, 0
    : +- Exchange hashpartitioning(dt#35, 200)
    : +- Scan hive tmp.l_table [l_id#33, l_name#34, dt#35], HiveTableRelation `tmp`.`l_table`, org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, [l_id#33, l_name#34], [dt#35], [isnotnull(dt#35), (dt#35 = 2021-11-09)]
    +- *(2) Sort [dt#38 ASC NULLS FIRST], false, 0
    +- Exchange hashpartitioning(dt#38, 200)
    +- Scan hive tmp.r_table [r_id#36, r_name#37, dt#38], HiveTableRelation `tmp`.`r_table`, org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, [r_id#36, r_name#37], [dt#38], [isnotnull(dt#38), (dt#38 = 2021-11-09)]|

  • 【Hive error】genColumnStatsTask

    今天在使用hive3.3的时候,hive语法报错 报错场景 解决方法 后面加limit

  • 活着真累啊

    活着真没意思

  • 120
    Flink CDC 原理、实践和优化

    CDC 变更数据捕获技术可以将源数据库的增量变动记录,同步到一个或多个数据目的。本文基于腾讯云 Oceanus 提供的 Flink CDC 引擎,着重介绍 Flink 在变更...

  • 120
    [Hudi学习笔记] Hudi 与Kudu、Hive Transactions、Hbase及Stream Processing的比较

    What is Hudi? Hudi是Hadoop Upserts anD Incrementals的缩写,用于管理HDFS上的大型分析数据集存储。 Hudi的主要目的是高效...

  • 120
    数据采集工具DATAX

    [TOC] DataX简介 Datax是阿里开源的支持多数据源的数据采集工具,能够实现 RDBMS/nosql数据库之间数据导入导出支持MySQL、Oracle 、HDFS、...

  • Hive-hdfs删除文件之后,元数据信息还存在的问题

    场景:今天在删除一个表分区数据的时候,直接删除的HDFS对应目录下的文件 ds=20230614 就是hdfs的数据删除了,使用show partitions tablena...

  • 120
    Dataworks简介

    前言 dataworks是一款 集数据采集\数据存储\数据计算\报表可视化\数据治理为一体的综合化\全链路的大数据开发治理平台 适用场景 比如说,我公司每日生成大数据量的业...

个人介绍
吾信吾之最笨,吾信勤能补拙
是什么,为什么,怎样做