上周线上的数据库慢日志统计中,有几条我所在项目的SQL查询光荣上榜,经过优化解决绝大多数关键SQL查询慢的问题,过程中又使用到了执行计划分析,著文以记之。
执行计划
通过explain命令查看执行计划。不加任何选项的情况下,默认显示查询执行计划,也可以使用partitions和extended选项查看执行计划,但一般不带任何选项的explain对于rd而言足矣。
正常情况下,使用查询计划查看SQL语句会显示如下:
这只是查询一个表,如果对多个表进行select操作则会显示多行。
id即使显示的行数。
table指执行计划所在的表,可能是实际存在的表,也可能是临时表。
type需要重点关注,代表了查询使用的索引类型,后文将对各种索引类型进行讲解。
possible_key是SQL语句可能使用的索引,注意是可能,有时会存在多个possiable_key,真正使用的可能有其中之一或者一个没用到。
key列是实际用到的索引,上图中的情况是可能使用的索引为idx_order索引,但实际未使用到,因此SQL的查询类型为ALL即全表扫描。
key_len是使用到索引的长度,一般规律是所用到索引的列数越多key_len越长,SQL的性能也就越佳。
ref列表示提供的哪种值作为参考,例如索引列为常数,则ref类型为const,该列无需过多关注。
rows:也是SQL性能衡量的一个指标,但很多情况下不准确,数据库引擎通过分析执行计划给出的一个大概的值,当然也是越少越好,毕竟行数越少查询效率越高。
Extra列是SQL的一些额外信息,无需过多关注。
综上而言,执行计划中需要重点关注的是type,possiable_key,key三个列。
常见select_type参考
select_type不是重点,总共有十几种select_type,但常见的select_type做个了解。
1.SIMPLE
顾名思义为简单查询,指不需要UNION操作或子查询的SQL语句。例如上图的单表查询。
select_type为SIMPLE的单位查询一定只有一个。
2.PRIAMRY
一个需要UNION操作或子查询的select执行计划,位于最外层的单位查询的select_type为PRIMARY。最外层的查询在内层基于union查询的结果形成的临时表中进行查询,DERIVED即内层SQL语句产生的临时表,id为1的行table列的<derived2>表示基于id为2的行所产生的临时表进行查询。
3.UNION
由union操作联合而成的单位select查询中,除第一个外,第二个以后的select_type都是UNION。如上图从id为3的列开始的union操作select_type为UNION,即使再加几条union语句,select_type都是UNION。
UNION RESULT为包含union结果的数据表。
type列详解
type列一共有12个值,依次是:
system
const
eq_ref
ref
fulltext
ref_or_null
unique_subquery
index_subquery
range
index_merge
index
all
一般而言,select语句的效率应当保证range及以上的级别。
1.system
访问仅有1条记录的数据库表或没有记录的空表时,访问方法为system。仅用于MyISAM或MEMORY存储的数据库表。
2.const
不受数据库表记录条数限制的情况下,查询中含主键或唯一键列的where条件子句时,通常采用const方式,查询一定会返回1条记录。3.eq_ref
只出现在要连接多个表的查询计划中。将先读取的数据库表列作为接下来要读取的数据库表的主键或唯一键列作为检索条件。
若主键或唯一键由多列组成,务必将全部列用作比较条件。
4.ref
ref方式在连接顺序和索引类型上无要求,无法保证查询必有1条(>=1)记录返回。
5.ref_or_null
在ref访问的基础上增加了null值的比较。
select * from order_info where order_id = '123' or order_id is null;
6.unique_subquery
用于where条件使用in (subquery)的情况,必须保证子查询返回唯一值。
7.index_subquery
与unique_subquery类似,但子查询结果可以不唯一。
unique_subquery:
select * from order_ext where order_id in (select order_id from order_info where id = 100);
index_subquery:
select * from order_ext where order_id in (select order_id from order_info where id = 100 or id = 200);
8.range
范围查询,也是常见的方式之一,但range以下的级别需要在项目中进行SQL优化。range级别检索索引时主要使用>,<, is null, between,in, like等运算符。