MySQL的基本架构示意图
从图中可以知道,MySQL可以分为两部分:server层和存储引擎层。并且不同的存储引擎共用一个Server层,也就是从连接器到执行器的部分。
server层包含如下的五部分:连接器、查询缓存、分析器、优化器、执行器等,涵盖MySQL的大多数核心服务功能,以及所有的内置函数,所有跨存储引擎的功能都在该层实现,如存储过程、触发器、视图等,不过MySQL 8.0之后,去掉了查询缓存这部分。
存储引擎层负责数据的存储和提取。其架构模式是插件式的,支持InnoDB、MyISAM、Memory等多个存储引擎。从5.6版本开始,InnoDB是MySQL的默认存储引擎,即在建表的时候,若不指定存储引擎的类型,默认使用的就是InnoDB。
连接器
连接器负责跟客户端建立连接、获取权限、维持和管理连接。连接命令如下:mysql -h$ip -P$port -u$user -p,输入该命令之后,需要在交互对话里面输入密码,不建议在-p后面直接输入密码,这样会导致密码泄露。连接命令中mysql是客户端工具,用来跟服务器建立连接。在完成TCP的三次握手之后,该连接器就要认证客户端的身份,即用户名和密码。若是用户名和密码不对,客户端会看到“Access denied for user”的错误提示,并结束客户端程序;若是通过,则到权限表查询用户的权限。
注意,一个用户一旦连接成功,即使使用管理员账号对该用户的权限做修改,也不会影响已经存在连接的权限。只有重启MySQL之后,新建的连接才会使用新的权限设置。
连接完成之后,若是后续没有动作,该连接就会处于空闲状态。可以使用show processlist命令查看每个连接的状态。其中Command列显示的就是连接的状态,若某连接的该列值为“Sleep”,则表明该连接为空闲连接。如果客户端太长时间没动静,连接器就会自动将它断开。这个时间是有参数wait_timeout控制的,默认值是8个小时。
在数据库中,有长连接和短连接之说,长连接指的是连接成功后,如果客户端持续有请求,则一直使用同一个连接。短连接则是指每次执行完很少的几次查询就断开连接,下次查询在重新建立一个。建立连接是一个很复杂的过程,因此尽量使用长连接,但是全部使用长连接,会有一个问题:长连接太多,MySQL占用的内存会涨得很快,因为MySQL在执行过程中临时使用的内存是管理在连接对象里面的。这些资源会在连接断开的时候才释放。因此,长连接累积下来,可能导致内存占用会过大,被系统强行杀掉。
可以采用如下的方案解决长连接累积导致内存占用过大的问题:1)定期断开长连接。2)若是5.7之后的版本,可以通过执行mysql_reset_connection来重新初始化连接资源。这个过程不需要重连和重新做权限验证,但是会将连接恢复到刚刚创建完时的状态。
查询缓存
MySQL收到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。之前执行过的语句以及其结果可能会以key-value对的形式,被直接缓存在内存中。key是查询的语句,value是查询的结果。如果查询能够直接在缓存中找到key,那么这个value就会被直接返回给客户端。如果语句不在查询缓存中,就会经过分析器、优化器以及执行器这个流程去查询所需要的结果。但是在大多数的情况下,不建议使用查询缓存,因为查询缓存往往弊大于利,毕竟查询缓存的失效是非常频繁的,只要有一个表的更新,这个表上的所有的查询缓存都会被清空,就会导致刚刚存入缓存的结果,还没有使用就失效。对于更新压力大的数据库来说,查询缓存的命中率会非常低。除非某业务使用的是一张静态表,很长时间才会更新一次。好在MySQL也提供一种“按需使用”的方式,将参数query_cache_type设置成DEMAND,这样对于默认的SQL语句都不使用查询缓存。而对于确定要使用查询缓存的语句,可以用SQL_CACHE显示指定,例如:select SQL_CACHE * from T where id = 10;
分析器
如果没有命中查询缓存,就要开始真正执行语句了。在执行语句之前,MySQL需要对SQL语句进行解析,明白该语句要做啥。分析器,首先会做“词法分析”,需要识别出SQL语句中的字符串分别是什么,代表什么。做完“词法分析”,就要做“语法分析”,根据词法分析的结果,语法分析器会根据语法规则判断SQL语句是否满足MySQL语法。如果不对就会报错。
优化器
经过分析器的解析,MySQL知道了SQL语句要干啥了,但在执行之前,还是要经过优化器的处理。优化器是在表里面有多个索引的时候,决定使用哪个索引;或者在一个语句有多表关联的时候,决定各个表的连接顺序。优化器阶段完成后,这个SQL语句的执行方案就确定下来了,然后进入执行器阶段。
执行器
在开始执行的时候,要先判断一下该用户是否对这个表有没有执行查询的权限,如果没有,就会返回没有权限的错误;如果有权限,就打开表继续执行。打开表的时候,执行器就会根据表引擎定义,去使用这个引擎提供的接口。