01 | 基础架构:一条SQL查询语句是如何执行的?
select * from T where ID=10
对于该sql的执行架构分析
MySQL基础架构
大体分为Server层和存储引擎两部分
Server层涵盖了大部分核心功能,包括分析,优化,执行,函数,视图,存储过程等
存储引擎负责数据的存储与提取
连接器
连接器负责跟客户端建立连接、获取权限、维持和管理连接。
通常连接mysql的命令如下:
mysql -uroot -p
如果认证成功,连接器会到权限表里面查出你拥有的权限。之后,这个连接里面的权限判断逻辑,都将依赖于此时读到的权限。也就是说,一旦连接建立,就算权限被修改,也只能在下次连接生效
连接完成后,如果你没有后续的动作,这个连接就处于空闲状态,使用show processlist
查看连接情况。
下面是我执行的情况:
+----+-----------------+-----------------+------------------------+---------+-------+------------------------+------------------+
| Id | User | Host | db | Command | Time | State | Info |
+----+-----------------+-----------------+------------------------+---------+-------+------------------------+------------------+
| 4 | event_scheduler | localhost | <null> | Daemon | 14401 | Waiting on empty queue | <null> |
| 17 | root | localhost:46946 | supermarket_background | Sleep | 4 | | <null> |
| 21 | root | localhost:46970 | <null> | Query | 0 | starting | show processlist |
+----+-----------------+-----------------+------------------------+---------+-------+------------------------+------------------+
如果客户端长时间空闲,则会自动断开连接,时间由参数wait_timeout
控制,默认为8小时=8*60*60=28800
。
mysql root@localhost:supermarket_background> show variables like 'wait_timeout'
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| wait_timeout | 28800 |
+---------------+-------+
连接可分为长连接与短连接,连接操作通常比较复杂,应该尽量使用长连接。
但是长连接可能导致MySQL内存过大,导致异常重启。因为MySQL临时使用的内存都在连接对象中,只有在连接断开时清除内存
解决方案
定期断开长连接。使用一段时间,或者程序里面判断执行过一个占用内存的查询后断开连接,之后要查询再重连。
如果你用的是 MySQL 5.7 或更新版本,可以使用mysql_reset_connection 来重新初始化连接资源将连接恢复到刚刚创建完时的状态。
查询缓存
大多数情况下不要使用查询缓存。表更新将会清空缓存
MySQL 8.0已移除该功能
分析器
解析SQL语句
优化器
决定选择执行方案,如选择索引
执行器
执行SQL语句
首先判断是否存在查询权限,如果没有,则返回权限错误
mysql> select * from T where ID=10;
ERROR 1142 (42000): SELECT command denied to user 'b'@'localhost' for table 'T'
如果有则打开表,根据指定的引擎接口执行
执行流程
- 调用InnoDB引擎接口获取第一行,判断ID值是否为10,是则存入结果集,否则跳过
- 继续调用接口读取下一行,知道最后一行
- 将结果集返回客户端
问题
- 对于表T中不存在字段k,执行SQL
select * from T where k=1
报错Unknown column ‘k’ in ‘where clause
,该错误是哪个阶段提供?
分析器。
Oracle会在分析阶段判断语句是否正确,表是否存在,列是否存在等。
解析器处理语法和解析查询, 生成一课对应的解析树。
预处理器进一步检查解析树的合法。比如: 数据表和数据列是否存在, 别名是否有歧义等。如果通过则生成新的解析树,再提交给优化器。
- 为什么对权限的检查不在优化器之前做?
有些时候,SQL语句要操作的表不只是SQL字面上那些。比如如果有个触发器,得在执行器阶段(过程中)才能确定。优化器阶段前是无能为力的