Eqo - 简书

发简信

Eqo

19
关注
33
粉丝
90
文章
55177

字数
158

收获喜欢
65

总资产

IP属地：浙江

Eqo

Hive Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.StatsTask
hive insert 在非overwrite 插入数据时,且表中已经存在数据时容易报以下错误这时只需要加上这条设置即可 set hive.stats.column.au...

387 0 2
Eqo

Hive3.x测试_null跟null 关联问题
结论: hive当中null与null 无法进行关联结果 NULL 没有关联上

134 0 1

Eqo ·

select * from tmp.l_table a join tmp.r_table b on a.dt = b.dt and a.dt = '2021-11-09' and b.dt = '2021-11-09'

-----执行计划
spark.sql(" explain select * from tmp.l_table a join tmp.r_table b on a.dt = b.dt and a.dt = '2021-11-09' and b.dt = '2021-11-09' ").show(100,false)
|== Physical Plan ==
*(3) SortMergeJoin [dt#35], [dt#38], Inner
:- *(1) Sort [dt#35 ASC NULLS FIRST], false, 0
: +- Exchange hashpartitioning(dt#35, 200)
: +- Scan hive tmp.l_table [l_id#33, l_name#34, dt#35], HiveTableRelation `tmp`.`l_table`, org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, [l_id#33, l_name#34], [dt#35], [isnotnull(dt#35), (dt#35 = 2021-11-09)]
+- *(2) Sort [dt#38 ASC NULLS FIRST], false, 0
+- Exchange hashpartitioning(dt#38, 200)
+- Scan hive tmp.r_table [r_id#36, r_name#37, dt#38], HiveTableRelation `tmp`.`r_table`, org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe, [r_id#36, r_name#37], [dt#38], [isnotnull(dt#38), (dt#38 = 2021-11-09)]|

云起时_0626 评论自Spark_性能调优及Spark3.0新特性
Eqo

Flink中文社区
写了 718115 字，被 34197 人关注，获得了 1084 个喜欢
Eqo

【Hive error】genColumnStatsTask
今天在使用hive3.3的时候,hive语法报错报错场景解决方法后面加limit

84 0 0
Eqo

活着真累啊
活着真没意思

66 0 0
Eqo

坨坨的大数据
写了 224047 字，被 278 人关注，获得了 420 个喜欢

搜罗大数据相关文章、大数据面试题、用户画像、供应链

Eqo

Flink CDC 原理、实践和优化
CDC 变更数据捕获技术可以将源数据库的增量变动记录，同步到一个或多个数据目的。本文基于腾讯云 Oceanus 提供的 Flink CDC 引擎，着重介绍 Flink 在变更...

坨坨的大数据
14368 1 29
Eqo

Java码农
写了 475618 字，被 646 人关注，获得了 1415 个喜欢
Eqo

[Hudi学习笔记] Hudi 与Kudu、Hive Transactions、Hbase及Stream Processing的比较
What is Hudi? Hudi是Hadoop Upserts anD Incrementals的缩写，用于管理HDFS上的大型分析数据集存储。 Hudi的主要目的是高效...

Kent_Yao
13210 1 8
Eqo

数据采集工具DATAX
[TOC] DataX简介 Datax是阿里开源的支持多数据源的数据采集工具,能够实现 RDBMS/nosql数据库之间数据导入导出支持MySQL、Oracle 、HDFS、...

1403 1 1
Eqo

Hive-hdfs删除文件之后,元数据信息还存在的问题
场景:今天在删除一个表分区数据的时候,直接删除的HDFS对应目录下的文件 ds=20230614 就是hdfs的数据删除了,使用show partitions tablena...

961 0 1

Eqo

Dataworks简介
前言 dataworks是一款集数据采集\数据存储\数据计算\报表可视化\数据治理为一体的综合化\全链路的大数据开发治理平台适用场景比如说,我公司每日生成大数据量的业...

1004 0 1
Eqo

望岫息心
写了 37245 字，被 333 人关注，获得了 15779 个喜欢
Eqo

Kent_Yao
写了 33384 字，被 214 人关注，获得了 156 个喜欢

医生晕血转码农~<br>Apache Spark Committer<br>Apache Kyuubi PPMC & Committer<br>Apache Submarine Committer
Eqo

乙腾
写了 261042 字，被 182 人关注，获得了 452 个喜欢

个人介绍

吾信吾之最笨,吾信勤能补拙
是什么,为什么,怎样做