MySQL实战01:一条SQL语句是如何执行的?
1.mysql的基础架构图
2.每个组件的介绍和功能
2.1 连接器
1.连接器负责和客户端建立连接、获取权限、维持和管理连接;
2.连接命令:mysql -hport -u$user -p
3.show processlist命令是来查看当前运行进程列表,客户端如果长时间没有进行连接的话,连接器就会自动断开连接,这个时间是由参数wait_timeout控制的。
4.数据库分为长连接(是指数据库连接成功后,如果客户端持续有请求的话就一直使用同一个连接。)和短连接(是指每次执行完很少的几个查询就会断开连接,下次查询的时候就会重新再建立一个连接)
5.因为建立连接的过程是比较复杂的,所以建议使用长连接;但是使用长连接的时候,有时候mysql会占用过多的内存,导致被系统强行杀掉,也就是MySQL异常重启。
5.1如何解决这个问题:
5.1.1.定期断开连接;(使用一段时间;程序在执行完一个占用内存比较大的查询之后可以断开连接等到要执行下一个查询的时候在进行连接。)
5.1.2.使用MySQL5.7及以上的版本时候,可以在每次执行一个比较大的操作的时候,通过执行mysql_reset_connection来重新初始化连接资源。这个过程不需要重连和重新做权限验证,但是会恢复到刚连接时候的状态。
2.2 查询缓存
1.mysql在拿到一个查询请求的时候,会去查询缓存看看,之前是不是执行过并且在被以key-value(SQL语句以及对应的查询结果)对的形式缓存到内存中,如果在查询缓存中的话就会被直接拿出来返回给客户端,否则就会继续下面的操作,等到执行完成后就会被存入查询缓存中去。因此如果查询命中缓存的话,mysql就不需要执行下面的操作,可以直接返回查询结果,这个效率是很高的。
2.但是我不建议使用查询缓存,因为在大多情况下使用查询缓存是弊大于利的?
2.1查询缓存的失效是非常频繁的,只用对莫一个表执行一次更新操作的话,那么该表的查询缓存就会失效(都被清空)。因此对于更新压力比较大的数据库来说,查询缓存的命中率非常低。
2.2因此mysql提供了“按需使用”,将参数query_cache_type设置成demand,这样对于默认的SQL语句都不使用查询缓存。而你对于要使用查询缓存的语句可以使用SQL_CACHE进行显示指定,就像下面的语句一样:select SQL_CACHE * from T where id = 10
3.需要注意的是在mysql8.0版本之后都没有查询缓存这个功能了。
2.3 分析器
1.如果没有命中缓存的话,就会开始进行词法分析(mysql需要分析你的语句中的多个字符串是什么以及所代表的含义,例如把select这个关键字识别出来,其代表查询语句;字符串T代表表名,column代表列column)以及语法分析(根据词法分析的结果,语法分析会根据mysql语法的规则来判断你是否符合mysql的语法,否则会出现you have an error in your sql syntax)。
2.4 优化器
1.在开始执行前还需要经过优化器的处理,优化器是在表里面有多个索引的时候,决定使用哪一个索引;或者在一个语句中有多表关联的时候,决定各个表的连接顺序。总之,优化器就是决定选择哪一种方案来进行执行。
2.5 执行器
1.开始执行的时候会判断你是否有没有权限去对该表进行(查询、更新、删除、插入)操作,如果有权限的话,就打开表继续执行,否则就会返回没有权限的错误。执行过程:
1.调用 InnoDB 引擎接口取这个表的第一行,判断ID值是不是10,如果不是则跳过,如果是则将这行存在结果集中;
2.调用引擎接口取下一行,然后继续判断是否满足条件,如果满足将这行存入结果集中,否则就继续以上的操作,直至取到表中的最后一行。
3.执行器将上述遍历之后满足的行存入结果集中返回给客户端。
3. 问题
1.如果表T中没有字段 k,而你执行了这个语句 select * from T where k=1, 那肯定是会报“不存在这个列”的错误: “Unknown column 'k' in 'where clause'”,你觉得这个错误会在哪里个阶段暴露出来?
答案: 是在分析器的时候就被发现了,分析器会进行词法分析,发现表中不存在该字段,因此返回该错误,而有的人会说在执行器中才被发现,因为执行器阶段才会打开表,但是K是表的结构,是一个字段而不是数据,可以在直接读取的不需要打开表,因此不是在执行器阶段。
参考引用:Mysql实现(极客时间),侵删!