mvcc
多版本并发控制
MVCC 只会在可重复读和读提交两个隔离级别下实现。
主要实现是
- 快照读(read view)
- undo log
快照读的创建时间有所不同,
read committed 是事务开启后每个select都会创建一个read view
repeatable committed 是事务开启后第一个select 创建一个read view
- undo log
unod log 是mvcc中重要的组成部分,undo里面存的是历史的数据,大多数存的undo 主要是delete和update
因为insert的undo比较特殊,insert之后,是没有事务立马去读取的,所以可以直接删除。
innodb对于每个表会有3个隐藏字段
- A 6-byte DB_TRX_ID field indicates the transaction identifier for the last transaction that inserted or updated the row. Also, a deletion is treated internally as an update where a special bit in the row is set to mark it as deleted.
- A 7-byte DB_ROLL_PTR field called the roll pointer. The roll pointer points to an undo log record written to the rollback segment. If the row was updated, the undo log record contains the information necessary to rebuild the content of the row before it was updated.
- A 6-byte DB_ROW_ID field contains a row ID that increases monotonically as new rows are inserted. If InnoDB generates a clustered index automatically, the index contains row ID values. Otherwise, the DB_ROW_ID column does not appear in any index
- 可见性比较
事务在开启瞬间会形成一个活跃未提交事务数组
所有未提交的活跃事务数组内最小的为 min_trx_id
所有未提交的活跃事务数组内最大的trx_id +1 为max_trx_id
假如我们在某个时刻有2个事务开始开启。
事务 | 本身事务id | 活跃事务列表 | min_trx_id | max_trx_id |
---|---|---|---|---|
事务A | 61 | [61,62] | 61 | 63 |
事务B | 62 | [61,62] | 61 | 63 |
假设一行数据如下
trx_id | 行里面的值 | roll_point |
---|---|---|
60 | name=zhangsan | 空 |
假如此时A事务在读取,发现trx_id=60 小于[61,62]这里面数组的最小值,表示这个60的trx_id 在A事务开启前就已经commit,所以可以读。
假如此时B事务把name=zhangsan 修改为name=lisi
那么A事务还可以读取吗?
A事务发现这一行的trx_id变成了62,在活跃事务数组内,则不可读,继续顺着undo找旧版本。
注意如下只作为演示,实际上数据库只有1行,name=zhangsan是在undo里面的
trx_id | 行里面的值 | roll_point |
---|---|---|
60 | name=zhangsan | 指向undo log name=lisi |
62 | name=lisi | 空 |
可见规则如下
已经提交事务列表 | min_trx_id | 活跃事务列表 | max_trx_id |
---|---|---|---|
事务开启前就已经提交,可见 | 可见 | 若在trx_id在活跃事务列表,则不可读,否则,则可读 | 不可读 |
这里面比较绕的是trx_id是否在活跃事务列表可读的情况,
因为活跃数组是一个范围值,里面有一个最小值和一个最大值,
假如在活跃事务数组内,除了事务自己的trx_id外,其他的都不可以读,因为都是活跃的时候创建的。
假如不在活跃数组内,那代表是已经提交了。
举个例子
活跃事务数组为[1,2,3,5]
有个事务id为4,那么这个4对于开启事务瞬间的A事务就是可读的。