了解select语句的执行顺序有助于更好的理解查询的子句和优化sql查询。自己以前也是很乱,今天仔细了解一下,就趁热打铁分享一下。
mysql中select查询语句的执行顺序遵循以下过程
#FROM ...,...-> ON -> (LEFT/RIGNT JOIN) -> WHERE -> GROUP BY -> HAVING -> SELECT -> DISTINCT -> ORDER BY -> LIMIT
我们来简单分析一下
一、select是先执行FROM这一步的,如果是多表连接查询,还会分出以下几个步骤
1. 通过join进行表连接求得笛卡尔积,相当于得到虚拟表(virtual table)表1-1
2. 通过on条件的筛选,在表1-1的基础上进行筛选得到表1-2
3. 添加外部行,如果连接是外连接的话,如果主表有些行的数据没匹配上,就被称为外部行,在这时加上,此时得到表1-3
到这里完成前两个表的连接,如果是多个表的话,需要重复上面的步骤,直到所有表被处理完。
二、我们拿到第一个步骤的最终结果表1之后,执行WHERE阶段,会对表1进行筛选得到表2
三、之后进入GROUP和HAVING阶段,先执行GROUP BY 进行分组得到表3,之后再根据HAVING对表三进行筛选得到表4
四、完成之后进入select,前面的步骤都是为获取结果做准备,直到这里,执行SELECT DISTINCT,得到表5-1和表5-2,自我感觉表5-1就是表4,毕竟已经将所有限制条件筛选完了,DISTINCT清除重复项得到表5-2
五、我们得到想要的数据后,就要去看以什么方式呈现,先根据ORDER BY 进行排序得到表6
六、再根据limit去限制输出的范围,至此查询结束,将结果输出。
看完分析,试着看看下面的语句执行顺序排个序
SELECT DISTINCT player_id, player_name, count(*) as num
FROM player JOIN team ON player.team_id = team.team_id
WHERE height > 1.80
GROUP BY player.team_id
HAVING num > 2
ORDER BY num DESC
LIMIT 2
(5,1,2,3,4,6,7)
虽然优化器会帮助我们优化能够优化的查询,但是我们最好还是尽量避免多表连接和复杂语句,这种操作不仅耗时而且费空间,了解select的执行过程后,我们在写查询的时候可以根据此来注意一下,尽量优化查询语句,虽然没有索引来的直接,但是不同的查询方式有的时候还是能起大作用的。