TiDB执行计划(一)

最近排查了项目中TiDB慢sql,查询执行计划时,发现TiDB执行计划详情和mysql的还有一些区别,今天来学习分享一下,发现内容有点过长,分几部分吧,今天主要来说说执行计划中算子吧

查询计划命令

EXPLAIN命令,可以查看TiDB执行sql时的执行计划,用法和mysql一样,跟上sql即可

EXPLAIN  SQL语句

举个栗子(脱敏数据)

执行 EXPLAIN

EXPLAIN 
select
  a0_.id,
  a0_.create_time,
  a0_.end_time,
  a0_.flow_id,
  a0_.campaign_id,
  a0_.unit_id,
  a0_.oa_id,
  a0_.org_path_,
  a0_.param,
  a0_.start_time,
  a0_.state,
  a0_.user_type,
  a0_.update_time,
  a0_.user_id
from
  table_a a0_
where
  a0_.campaign_id = 354361236223
  and a0_.user_id = 25325123
  and a0_.user_type = 1
  and a0_.param = '1'
limit
  1000

执行计划结果

执行计划结果

执行计划以一个树形结构展示出来,来说说每一列的含义吧:

  • id 为算子,是执行sql时,每一步需要执行子任务
  • estRows为每一个子任务预估需要处理的行数
  • task为子任务执行时候所在的位置
  • access-object子任务放的对象,比如说表、索引等
  • operator info子任务执行时候的一些算是操作日志的信息吧

今天主要讲讲算子

id:为算子,是执行sql时,每一步需要执行子任务

算子是为返回查询结果而执行的特定步骤

TiDB的算子主要分成为两类,第一类为扫表类操作的算子,第二类为汇聚TiKV/TiFlash上扫描的数据或者计算结果的算子

第一类算子:扫表类操作的算子

扫表类操作的算子有如下几类:

TableFullScan:全表扫描

一般查询条件中没有用到索引或者索引失效了,执行计划中就会出现TableFullScan

TableFullScan栗子

select
  * 
from
  tablea a0_

这个sql,没有用到索引肯定就全表扫描了,执行计划如下:


TableFullScan栗子

看的到执行计划中,出现TableFullScan,id为TableFullScan + 了一个序号,说明,这一步执行的子任务进行全表扫描

IndexFullScan:全量扫描索引数据

IndexFullScan栗子1:聚合查询IndexFullScan栗子,使用COUNT

select
  COUNT(user_id)
from
  tablea a0_

这个sql,对于索引列user_id使用了COUNT函数,导致了执行时需要对所有索引数据进行扫描,会出现IndexFullScan算子,执行计划如下:

IndexFullScan栗子1

看的到执行计划中,出现IndexFullScan,id为IndexFullScan + 了一个序号,说明,这一步执行的子任务进行对索引列user_id进行了全索引数据的扫描

IndexFullScan栗子2:聚合查询IndexFullScan栗子,使用group by

select
  user_id
from
  tablea a0_
GROUP by
  user_id

这个sql,对于索引列user_id使用了group by,导致了执行时需要对所有索引数据进行扫描,会出现IndexFullScan算子,执行计划如下:

IndexFullScan栗子2

看的到执行计划中,出现IndexFullScan,id为IndexFullScan + 了一个序号,说明,这一步执行的子任务进行对索引列user_id进行了全索引数据的扫描

IndexFullScan栗子3:聚合查询IndexFullScan栗子,使用min函数

select
  MIN(user_id)
from
  tablea a0_

这个sql,对于索引列user_id使用了min函数,导致了执行时需要对所有索引数据进行扫描,会出现IndexFullScan算子,执行计划如下:

IndexFullScan栗子3

看的到执行计划中,出现IndexFullScan,id为IndexFullScan + 了一个序号,说明,这一步执行的子任务进行对索引列user_id进行了全索引数据的扫描

IndexFullScan栗子4:子查询IndexFullScan栗子,使用索引IN 子查询,当子查询为全量时

select
  *
from
  tablea a0_
where
  user_id IN (
    select
      user_id
    from
      tablea
  )

这个sql,对于索引列user_id使用了in,子查询为全表扫描,所以会导致外层查询会对索引列user_id进行全索引数据进行扫描,会出现IndexFullScan算子,执行计划如下:

IndexFullScan栗子

来看看执行计划,首先,子查询没有加条件,是一个全表扫描,看执行计划2的地方,出现了一个TableFullScan_49,由于子查询是全量数据,所以当外层sql对索引列user_id进行In时候,会对索引列user_id进行全索引数据的扫描,出现IndexFullScan

IndexFullScan栗子5:join查询IndexFullScan栗子,使用left join,当左联表为全量数据时

select
  a0_.*,
  a1_.*
from
  tablea a0_
  LEFT JOIN (
    select
      *
    from
      tablea
  ) as a1_ ON a0_.user_id = a1_.user_id

这个sql,使用了索引列user_id进行了left join,当左联表为全表扫描时,会导致对索引列user_id进行全索引数据进行扫描,会出现IndexFullScan算子,执行计划如下:

IndexFullScan栗子5

来看看执行计划,左联表是一个全表扫描,所以会对索引列user_id进行全索引数据的扫描,出现IndexFullScan

TableRowIDScan:根据上层传递下来的rowId扫描表数据,通俗的讲,就是查询先走索引获取到rowId,在根据rowId读取数据

根据上层传递下来的rowId扫描表数据,通俗的讲,就是查询先走索引获取到rowId,在根据rowId读取数据,执行计划中就会出现TableRowIDScan ,举个栗子

TableRowIDScan栗子

select
  * 
from
  tablea a1_
where
  a1_.user_id = 123214125

就一个简单的sql来看一下,执行计划如下:

TableRowIDScan栗子

因为使用了索引列user_id,所以,查询方式是从索引获取到了rowId,通过rowId去读取表数据,所以看到执行计划中,出现TableRowIDScan,id为TableRowIDScan + 了一个序号,说明,这一步执行的子任务是通过送索引获取到的rowId扫描表数据

IndexRangeScan:带有范围的索引数据扫描

带有范围的索引数据扫描,还是用这个栗子吧

TableRowIDScan栗子

select
  * 
from
  tablea a1_
where
  a1_.user_id = 123214125

就一个简单的sql来看一下,执行计划如下:

TableRowIDScan栗子

因为对索引列user_id使用范围查询,所以看到执行计划中,出现IndexRangeScan,id为IndexRangeScan + 了一个序号,说明,这一步执行的子任务是带有范围的索引数据扫描

第二类算子:汇聚TiKV/TiFlash上扫描的数据或者计算结果的算子

数据汇聚类的算子有如下几类:

TableReader:将上底层扫表算子TableFullScan或TableRangeScan得到的数据进行汇总

将上底层扫表算子TableFullScanTableRangeScan得到的数据进行汇总

TableReader汇聚全表扫描TableFullScan的栗子

select
  * 
from
  tablea a1_

这个sql,没有用到索引肯定就全表扫描了,执行计划如下:


TableReader汇聚全表扫描TableFullScan的栗子

看的到执行计划中,因为没有使用索引查询,进行了全表扫描,出现了TableFullScan,所以最终使用了TableReader算子,对于全表扫描的数据进行了汇总

IndexReader:将上底层扫表算子IndexFullScan或IndexRangeScan得到的数据进行汇总

将上底层扫表算子IndexFullScanIndexRangeScan得到的数据进行汇总

IndexReader汇聚全量索引扫描IndexFullScan的栗子

select
  MIN(user_id)
from
  tablea a0_

还是使用这个sql,由于对索引列使用min函数,所以会对对全量索引进行扫描,出现了IndexFullScan算子,所以会有IndexReader算子对于IndexFullScan算子得到数据进行汇总,执行计划如下:

IndexReader汇聚全量索引扫描IndexFullScan的栗子
IndexLookUp

先汇总Build端TiKV扫描上来的RowID,再去Probe端上根据这些RowID精确地读取TiKV上的数据。Build 端是 IndexFullScanIndexRangeScan 类型的算子,Probe端TableRowIDScan 类型的算子,用sql举栗子吧

IndexLookUp栗子

select
  * 
from
  tablea a1_
where
  a1_.user_id = 123214125

执行计划如下:

IndexLookUp栗子

看这个sql,是一个通过索引列user_id进行了索引范围扫描,和上面讲的一样,他的执行逻辑是,先通过对于索引列user_id进行了一个范围扫描,得到所有符合条件的rowId,然后通过rowId扫描表获得数据,看执行也是,首先在Build端,通过IndexRangeScan算子,对于索引列user_id进行了范围扫描,扫描到的rowId,在Probe端,在通过TableRowIDScan算子,通过rowId扫描表获取数据,最终通过IndexLookUp算子来汇聚最终的数据

3.算子执行的顺序
  • 算子的结构是树状的,但在查询执行过程中,并不严格要求子节点任务在父节点之前完成。而且TiDB执行同一查询的各个节点并行执行
  • 还是以上个sql为栗子
select
  a0_.*,
  a1_.*
from
  tablea a0_
  LEFT JOIN (
    select
      *
    from
      tablea
  ) as a1_ ON a0_.user_id = a1_.user_id

执行计划如下:


image.png

每一层级上,Build端总是先于Probe端执行,并且Build端总是出现在Probe端前面

TiDB执行计划中的算子就为大家说到这里,后面会为大家补上task等的信息,欢迎大家来交流,指出文中一些说错的地方,让我加深认识。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容