Hive报错not in the vectorization context column map分析及解决方法

/*

先说结论,我不知道为什么报错,但是我知道怎么解决。抛砖引玉,期待高人指路。

*/

1.问题出现

近日,在提交下面这段Hive SQL时,会报出SemanticException错误

SELECT

    APP_TP                              as APP_TP,

    TOUCH_TP                            as TOUCH_TP,

    ext_card_attr_cd                    as CARD_ATTR_ID,

    ext_card_brand_cd                  as CARD_BRAND_ID,

    ISS_INTNL_ORG_ID_CD                as ISS_INTNL_ORG_ID_CD,

    ISS_ROOT_INS_ID_CD                  as ISS_ROOT_INS_ID_CD,

    count(distinct pri_acct_no_conv)    as ACTIVE_CARD_NUM

from table_test_mon a

where trim(a.hp_settle_month) = '202402'

group by APP_TP             

        ,TOUCH_TP           

        ,ext_card_attr_cd       

        ,ext_card_brand_cd     

        ,ISS_INTNL_ORG_ID_CD

        ,ISS_ROOT_INS_ID_CD

union all

select

  APP_TP                              as APP_TP,

  '0'                                as TOUCH_TP,

  ext_card_attr_cd                    as CARD_ATTR_ID,

  ext_card_brand_cd                  as CARD_BRAND_ID,

  ISS_INTNL_ORG_ID_CD                as ISS_INTNL_ORG_ID_CD,

  ISS_ROOT_INS_ID_CD                  as ISS_ROOT_INS_ID_CD,

  count(distinct pri_acct_no_conv)    as ACTIVE_CARD_NUM

from table_test_mon a

where trim(a.hp_settle_month) = '202402'

group by  APP_TP             

        ,ext_card_attr_cd       

        ,ext_card_brand_cd     

        ,ISS_INTNL_ORG_ID_CD

        ,ISS_ROOT_INS_ID_CD;

错误信息是

Error while compiling statement: FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: The column KEY._col6:0._col0 is not in the vectorization context column map {KEY._col0=0, KEY._col1=1, KEY._col2=2, KEY._col3=3, KEY._col4=4, KEY._col5=5, KEY._col6=6}. (state=42000,code=40000)

2.原因分析

第一次看见这个报错时,我是十分疑惑的,因为这段SQL并不复杂,只是简单的group by、count,最后将两端结果union all连接在一起。另外KEY._col0、KEY._col1等名称不是常规的字段名、表名,从字面上看不出什么端倪。我猜想这可能是执行计划中的临时别名,于是我对union all前面的一段SQL查看执行计划,发现其中有下面这一段

Reducer 2

    Needs Tagging: false                 

    Reduce Operator Tree:                 

      Group By Operator                   

        aggregations: count(DISTINCT KEY._col6:0._col0)

        keys: KEY._col0 (type: string), KEY._col1 (type: string), KEY._col2 (type: string), KEY._col3 (type: string), KEY._col4 (type: string), KEY._col5 (type: string)

        mode: mergepartial               

        outputColumnNames: _col0, _col1, _col2, _col3, _col4, _col5, _col6

        Statistics: Num rows: 997 Data size: 183055 Basic stats: COMPLETE Column stats: NONE

        File Output Operator             

与报错信息对比,可以得出KEY._col6:0._col0是DISTINCT.pri_acct_no_conv的别名,而KEY._col0~KEY._col5是select从句中其他的六个字段。而执行计划中的outputColumnNames(reduce阶段输出的键值对的key名)则是_col0, _col1, _col2, _col3, _col4, _col5, _col6,没有_col6:0._col0,这就是The column KEY._col6:0._col0 is not in the vectorization context column map的字面解读。

但是经过上面的简单翻译,还是不明白为什么会报错。所以我将union两端SQL中的distinct去掉,再次查看整段SQL的执行计划。发现其中有下面这一段

Reducer 2

    Execution mode: vectorized           

    Needs Tagging: false                 

    Reduce Operator Tree:                 

      Group By Operator                   

        aggregations: count(VALUE._col0) 

        keys: KEY._col0 (type: string), KEY._col1 (type: string), KEY._col2 (type: string), KEY._col3 (type: string), KEY._col4 (type: string), KEY._col5 (type: string)

        mode: mergepartial               

        outputColumnNames: _col0, _col1, _col2, _col3, _col4, _col5, _col6

        Statistics: Num rows: 997 Data size: 183055 Basic stats: COMPLETE Column stats: NONE

        File Output Operator             

执行计划中加粗的一行表明这一个reduce阶段是以向量化查询的方式执行(Vectorized Query Execution)。Hive wiki上对向量化查询执行的解释(https://cwiki.apache.org/confluence/display/Hive/Vectorized+Query+Execution#app-switcher)是

向量化查询执行是Hive的一项功能,可大大减少典型查询操作(如扫描,过滤器,聚合和联接)的CPU使用率。标准查询执行系统一次处理一行。这在执行的内部循环中涉及长代码路径和重要的元数据解释。向量化查询执行通过一次处理一个1024行的块来简化操作。在该块内,每一列都存储为向量(原始数据类型的数组)。诸如算术和比较之类的简单操作是通过在一个紧密的循环中快速迭代向量而完成的,循环内没有或只有很少的函数调用或条件分支。平均而言,这些循环以精简的方式编译,使用相对较少的指令,并以较少的时钟周期完成每条指令,通过有效地使用处理器管道和高速缓存。

所以我猜想问题出在向量化执行上面。union all两端的SQL都分别可以顺利执行,但是union all到一起就不行。推测是在union all的过程中自动触发了向量化执行优化,尝试将两端的SQL group by的结果拼接到一起组成batch,过程中编译器突然发现聚合函数之外本来应该只有六个字段,即KEY._col0~KEY._col5,有5个键。而此时眼前却分明还有一个distinct出来的KEY._col6:0._col0,故无法顺利将每一列都转化为向量,遂报错。而如果去掉distinct,count的结果是VALUE._col0,是键值对中的值,不会增加键的个数,于是可以顺利执行。

注:以上都是我瞎想的。

3.解决方法

推测出了大概原因,那么我们可以通过关闭向量化执行来解决问题,以下语句亲测可用。

set hive.vectorized.execution.enabled = false;

另外,如果是Hive on spark报出以上错误,还可以将引擎切换为MapReduce试试,我也试过可以用。

set hive.execution.engine=mr;


上网搜一搜,发现其实也有人提出了类似的问题(https://community.cloudera.com/t5/Support-Questions/hive-vectorization-union-all-problem/m-p/183179),但是一直没有人正面解答。在hive社区中,有一个类似问题作为bug被提出https://issues.apache.org/jira/browse/HIVE-17978,其中一名开发者表示

在后续操作中,我们将允许合并两个都具有半联接分支的TS。此外,我们应该考虑在删除半联接分支之后运行共享工作优化器。

页面显示该问题会在Hive3.0中修复,期待公司升级为Hive3.0的时候。

唉,我还是太菜了,要继续学习啊。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,723评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,080评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,604评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,440评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,431评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,499评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,893评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,541评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,751评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,547评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,619评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,320评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,890评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,896评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,137评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,796评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,335评论 2 342