本文将主要研究如何通过WHERE语句来进行优化。在本文的例子中将使用SELECT语句中的WHERE语句,但是在DELETE语句和UPDATE语句中WHERE字句的优化是相同的。
Node:
由于MySQL优化器的工作官方还在进行开发和优化中,所以这里并没有记录MySQL执行的所有优化。
你可能想重写查询以使算术运算更快,但是会牺牲查询语句的可读性。由于MySQL会自动进行类似的优化,因此通常可以避免这种工作,并以更易于理解和维护的形式保留查询语句的可读性。MySQL执行的一些优化如下:
- 去掉不必要的括号:
((a AND b) AND c OR (((a AND b) AND (c AND d))))
-> (a AND b AND c) OR (a AND b AND c AND d)
- 常数合并:
(a<b AND b=c) AND a=5
-> b>5 AND b=c AND a=5
- 恒定条件移除(由于不断折叠而需要):
(B>=5 AND B=5) OR (B=6 AND 5=5) OR (B=7 AND 5=6)
-> B=5 OR B=6
- 索引使用的常量表达式只计算一次。
- 对于没有使用WHERE子句的三表使用COUNT(*)语句的时候可以直接从MyISAM和MEMORY表中获取表信息。这种情况同时也适用于任何作用于单表的NOT NULL语句。
- 尽早的检查无结果返回的语句。MySQL不能够快速发现对一些SELECT语句的不可执行,并且不会返回任何行信息。
- 如果不使用GROUP BY或聚合函数(COUNT()、MIN()等),HAVING语句则与WHERE合并。
- 对于连接中的每个表,一个更简单的WHERE语句用来为表构建一个快速的WHERE语句的评估,并且能够尽快跳过行。
- 在查询中的任何其他表之前,首先读取所有常量表。常数表有下列任何一种:
- 一个空表或者一个只有一行的表
- 一个表的WHERE语句建立在主键或者唯一性索引上,所有的索引与常量表达式进行比较,并且被定义为非空的。
下面的语句都是用到了常量表:
SELECT * FROM t WHERE primary_key=1;
SELECT * FROM t1,t2
WHERE t1.primary_key=1 AND t2.primary_key=t1.id;
- 连接表的最佳连接组合是通过尝试所有可能性找到的。如果按 ORDER BY和GROUP BY子句顺序排列的所有列都来自同一个表,那么在连接时首选该表。
- 如果ORDER BY子句和不同的GROUP BY子句存在,或者ORDER BY或GROUP BY包含联接队列中第一个表以外的表中的列,那么将创建一个临时表。
- 如果使用SQL_SMALL_RESULT修饰符,MySQL将使用内存中的临时表。
- 查询每个表索引,并使用最佳索引,除非优化器认为使用表扫描更有效。曾经,使用扫描是基于最佳索引是否跨越表的30%,但是固定的百分比不再决定是使用索引还是扫描。优化器现在更加复杂,它的评估基于其他因素,如表大小、行数和I/O块大小等。
- 在某些情况下,MySQL甚至不需要查询数据文件就可以从索引中读取行。如果索引中使用的所有列都是数字,则仅使用索引树来解析查询。
- 在输出每一行之前,跳过那些与HAVING子句不匹配的行。
下面是一些查询非常快的语句的示例:
SELECT COUNT(*) FROM tbl_name;
SELECT MIN(key_part1),MAX(key_part1) FROM tbl_name;
SELECT MAX(key_part2) FROM tbl_name WHERE key_part1=constant;
SELECT ... FROM tbl_name
ORDER BY key_part1,key_part2,... LIMIT 10;
SELECT ... FROM tbl_name
ORDER BY key_part1 DESC, key_part2 DESC, ... LIMIT 10;
MySQL仅使用索引树解决以下查询,假设索引列是数字:
SELECT key_part1,key_part2 FROM tbl_name WHERE key_part1=val;
SELECT COUNT(*) FROM tbl_name
WHERE key_part1=val1 AND key_part2=val2;
SELECT key_part2 FROM tbl_name GROUP BY key_part1;
以下查询使用索引来检索按排序顺序排列的行,而不需要单独的排序传递:
SELECT ... FROM tbl_name
ORDER BY key_part1,key_part2,... ;
SELECT ... FROM tbl_name
ORDER BY key_part1 DESC, key_part2 DESC, ... ;