Mysql实战45讲

01 | 基础架构:一条SQL查询语句是如何执行的?

MySql 逻辑架构图

image.png

image.png

执行 create table 建表的时候,如果不指定引擎类型,默认使用InnoDB。
不同的存储引擎共用一个Server 层。

连接器
连接器负责跟客户端建立连接、获取权限、维持和管理连接。

mysql -h$ip -P$port -u$user -p

一个用户成功建立连接后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建连接才会使用新的权限设置。

查看连接信息


image.png

客户端如果太长时间没动静,连接器就会自动将它断开。这个时间是由参数 wait_timeout 控制的,默认值是8小时。如果在连接被断开之后,客户端再次发送请求的话,就会收到一个错误提醒: Lost connection to MySQL server during query。

查询缓存

image.png

image.png
mysql> select SQL_CACHE * from T where  id = 10

MySQL 8.0 版本直接将查询缓存的整块功能删掉了。

分析器
词法分析(识别关键字,操作,表名,列名)
语法分析 (判断是否符合语法)

优化器
优化器是在表里面有多个索引的时候,决定使用哪个索引;或者在一个语句有多表关联(join)的时候,决定各个表的连接顺序。
优化器阶段完成后,这个语句的执行方案就确定下来了,然后进入执行器阶段。

执行器
开始执行的时候,要先判断一下你对这个表 T 有没有执行查询的权限。如果没有,就会返回没有权限的错误
。如果命中查询缓存,会在查询缓存返回结果的时候,做权限验证。查询也会在优化器之前调用 precheck 验证权限。

如果有权限,就打开表继续执行。打开表的时候,执行器就会根据表的引擎定义,去调用这个引擎提供的接口。

在数据库的慢查询日志中看到一个rows_examined 的字段,表示这个语句执行过程中扫描了多少行,这个值就是在执行器每次调用引擎获取数据航的时候累加的。

在有些场景下,执行器调用一次,在引擎内部则扫描了多行,因此引擎扫描行数跟rows_examined并不是完全相同的

02 | 日志系统:一条SQL更新语句是如何执行的?

查询语句的那一套流程,更新语句也是同样会走一遍。

mysql> create table T(ID int primary key, c int);

mysql> update T set c=c+1 where ID=2;
  1. 执行语句前要先连接数据库,这是连接器的工作。
  2. 在一个表上有更新的时候,跟这个表有关的查询缓存会失效,所以这条语句就会把表 T 上所有缓存结果都清空。
  3. 分析器会通过词法和语法解析知道这是一条更新语句。
  4. 优化器决定要使用 ID 这个索引。
  5. 执行器负责具体执行,找到这一行,然后更新。

与查询流程不一样的是,更新流程还涉及两个重要的日志模块:redo log 和binlog。

redo log

WAL 的全称是 Write-Ahead Logging,它的关键点就是先写日志,再写磁盘,也就是先写粉板,等不忙的时再写账本。


image.png
image.png
image.png
binlog

MySQL 整体来看,其实就有两块:一块是 Server 层,它主要做的是 MySQL 功能层面的事情;还有一块是引擎层,负责存储相关事宜。

粉板 redo log 是 InnoDB 引擎特有的日志,而server层也有自己的日志,称为 binlog(归档日志)。

redolog 与 binlog的区别:


image.png

有了对这两个日志的概念性理解,我们再来看执行器和 InnoDB 引擎在执行这个简单的 update 语句时的内部流程。


image.png
image.png

将 redo log 的写入拆成了两个步骤:prepare 和 commit,这就是"两阶段提交"。

由于 redo log 和 binlog 是两个独立的逻辑,如果不用两阶段提交,要么就是先写完 redo log 再写 binlog,或者采用反过来的顺序。我们看看这两种方式会有什么问题。

image.png

可以看到,如果不使用“两阶段提交”,那么数据库的状态就有可能和用它的日志恢复出来的库的状态不一致。

binlog作用
  • 恢复数据库(全量备份 + 备份时间点后的binglog)
  • 扩容搭建备库(全量备份 + 备份时间点后的binglog)
  • 同步数据
image.png

03 | 事务隔离:为什么你改了我还看不见?

简单来说,事务就是要保证一组数据库操作,要么全部成功,要么全部失败

在 MySQL 中,事务支持是在引擎层实现的。MySQL 原生的 MyISAM 引擎就不支持事务,这也是MyISAM 被 InnoDB 取代的重要原因之一。
ACID(Atomicity、Consistency、Isolation、Durability,即原子性、一致性、隔离性、持久性)。

image.png
image.png
image.png
mysql> show variables like 'transaction_isolation';

+-----------------------+----------------+

| Variable_name | Value |

+-----------------------+----------------+

| transaction_isolation | READ-COMMITTED |

+-----------------------+----------------+
image.png
image.png

你可以在 information_schema 库的innodb_trx 这个表中查询长事务,比如下面这个语句查询超过60s的事务

select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60

04 | 深入浅出索引(上)

索引的出现其实就是为了提高数据查询的效率,就像书的目录一样。

索引的常见模型

  1. 哈希表
    哈希表是一种以键 - 值(key-value)存储数据的结构,输入待查找的值即 key,就可以找到其对应的值即 Value.
    用一个哈希函数把 key 换算成一个确定的位置,然后把 把 value 放在数组的这个位置。
    多个 key 值经过哈希函数的换算,会出现同一个值的情况(哈希冲突)。处理这种情况的一种方法是,拉出一个链表。
    增删改,等值查询很快, 但因为不是有序的,哈希索引做区间查询的速度是很慢的。
    哈希表这种结构适用于只有等值查询的场景,比如Memcached 及其他一些 NoSQL 引擎。

  2. 有序数组
    有序数组在等值查询和范围查询场景中的性能就都非常优秀。
    如果仅仅看查询效率,有序数组就是最好的数据结构了。但是,在需要更新数据的时候就麻烦了,你往中间插入一个记录就必须得挪动后面所有的记录,成本太高。
    有序数组索引只适用于静态存储引擎。

  3. 二叉搜索树
    二叉搜索树的特点是:每个节点的左儿子小于父节点,父节点又小于右儿子节点。查询复杂度是O(logN)。
    当然为了维持 O(log(N)) 的查询复杂度,你就需要保持这棵树是平衡二叉树。为了做这个保证,更新的时间复杂度也是O(logN)。

image.png

覆盖索引

由于覆盖索引可以减少树的搜索次数,显著提升查询性能,所以使用覆盖索引是一个常用的性能优化手段。

最左前缀原则

极客时间版权所有: https://time.geekbang.org/column/article/0?cid=139

不只是索引的全部定义,只要满足最左前缀,就可以利用索引来加速检索。这个最左前缀可以是联合索引的最左 N 个字段,也可以是字符串索引的最左 M 个字符。
查询条件匹配复合索引最左的N个字段,就可以使用该联合索引。
字符串查询条件可以根据字符串最左M个字符,来匹配索引。

在建立联合索引的时候,如何安排索引内的字段顺序?
第一原则是,如果通过调整顺序,可以少维护一个索引,那么这个顺序往往就是需要优先考虑采用的。
例如,有a,b 联合查询的需求,又有b独立查询的需求,这时应该建联合索引(b,a),而不是(a,b) 。

索引条件下推(index condition pushdown)

MySQL 5.6 引入的索引下推优化(index condition pushdown), 可以在索引遍历过程对索引中包含的字段先做判断,直接过滤掉不满足条件的记录,减少回表次数。
例如有联合索引(a,b), 查询条件是a=x and b=y and c=z, 在Mysql5.6前,先在联合索引中找到a=x的所有记录,然后回表在主键索引中匹配b,c条件。利用索引下推则可以直接在索引(a,b)中匹配a,b 条件,减少回表的记录数。

06 | 全局锁和表锁 :给表加个字段怎么有这么多阻碍?

image.png

image.png

同步过程中,如果加全局锁,关联的表数据(例如订单、余额)会有一致性问题。

image.png
image.png
image.png
image.png

事务中的 MDL 锁(读锁、写锁),在语句执行开始时申请,但是语句结束后并不会马上释放,而会等到整个事务提交后再释放。

image.png

07 | 行锁功过:怎么减少行锁对性能的影响?

MySQL 的行锁是在引擎层由各个引擎自己实现的。但并不是所有的引擎都支持行锁,比如MyISAM引擎就不支持行锁。不支持行锁意味着并发控制只能使用表锁,对于这种引擎的表,同一张表上任何时刻只能有一个更新在执行,这会影响到业务并发度。InnoDB 是支持行锁的,这也是 MyISAM 被 InnoDB替代的重要原因之一。

在 InnoDB 事务中,行锁是在需要的时候才加上的,但并不是不需要了就立刻释放,而是要等到事务结束时才释放。这个就是两阶段协议。
如果你的事务中需要锁多个行,要把最可能造成锁冲突、最可能影响并发度的锁尽量往后放。

死锁和死锁检测

image.png
image.png
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 196,302评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,563评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,433评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,628评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,467评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,354评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,777评论 3 387
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,419评论 0 255
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,725评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,768评论 2 314
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,543评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,387评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,794评论 3 300
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,032评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,305评论 1 252
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,741评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,946评论 2 336

推荐阅读更多精彩内容