之前我们讨论过了关于并发写中的dirty writes和lost updates的情况,本文我们介绍最后一种并发写的问题,和对应的弱隔离性的实现。
写偏(Write skew)和幻读(Phantoms)
这里我们假设一个场景:一家医院需要医生值班,要求在任何时间都必须有至少一个医生在值班。现在Alice和Bob是两个在值班的医生,他们两个都感觉不舒服,想要请求离开。他们恰巧在同一时刻发起请求,那么会出现如下的场景:
每个事务最初检查是否有大于等于两个医生在值班,由于使用了snapshot isolation,判断为是,然后继续执行下一阶段。每个事务更新不同的数据对象,然后提交事务。但是最终结果是没有医生在值班了。
write skew的分析
write skew不等同于lost update,lost update是两个事务修改同一个数据对象,但write skew是修改不同的数据对象,但和lost update相似的是,它们产生冲突原因很相似。因此,我们可以将write skew视为是lost update问题的泛化。
write skew的解决方案
结合lost update的解决方案,我们来分析一下write skew的解决方案:
- 单数据对象的原子操作是不可行的,因为这里涉及到多个数据对象;
- 在lost update中使用到的数据库的自动检测也是不可行的;
- 一些数据库可以配置一些约束,比如唯一性、外键的限制、特殊值限制等。但在医生的例子中,由于限制会包括多行数据,是无法添加的;
- 如果无法用完整的隔离性,也可以考虑对这次事务使用的数据加锁,比如医生的例子中,可以用以下的事务实现:
BEGIN TRANSACTION;
SELECT * FROM doctors
WHERE on_call = true
AND shift_id = 1234 FOR UPDATE;
UPDATE doctors
SET on_call = false
WHERE name = 'Alice'
AND shift_id = 1234;
COMMIT;
write skew的更多例子
我们举几个write skew的其他例子:
- 会议室预定系统:两个事务同时预定一个空闲的会议室,出现会议室重复预定的情况。
BEGIN TRANSACTION;
-- Check for any existing bookings that overlap with the period of noon-1pm
SELECT COUNT(*) FROM bookings
WHERE room_id = 123 AND
end_time > '2015-01-01 12:00' AND start_time < '2015-01-01 13:00';
-- If the previous query returned zero:
INSERT INTO bookings
(room_id, start_time, end_time, user_id)
VALUES (123, '2015-01-01 12:00', '2015-01-01 13:00', 666);
COMMIT;
- 多人游戏:多人操纵多个游戏目标,并且游戏目标存在全局的约束。
- 申请一个用户名:多人同时使用一个用户名,违反了用户名的唯一性。这个可以通过在数据库中配置唯一性约束来避免;
- 超支购买:在购买支付前,需要判断用户有足够的余额支付,两个同时发生的购买行为可能存在write skew的风险。
幻读(Phantoms)
幻读指的是一个事务改变了另外一个事务的查询结果,是导致write skew出现的原因。write skew的发生遵循以下的模式:
- select语句通过查询数据库的一些行,得到我们想要用于判断的数据;
- 根据第一步查询的结果,进行下一步行为是否执行的判断;
- 如果继续执行,写数据并且提交事务。
这个步骤也可能有一些改变,比如先写数据库,然后查询,最终判断是提交还是中止这个事务。
snapshot isolation可以避免只读查询的幻读现象,但在读写的场景下,幻读会导致write skew的出现。
物化冲突
对于医生的场景,由于是查询数据库中的已有记录进行判断,因此可以在查询时加行锁,然后避免write skew。但对于会议室预定的例子,由于查询的是该会议室没有被预定,并没有可以加锁的数据行,因此需要采用一种物化冲突的方式来解决。
具体操作是将每个会议室,在未来一段时间的所有可预订时间,都提前写好在数据表中。然后在预定的事务发起时,对该表的数据行进行加锁。这里注意的是,该表并不是实际的预定表,预定的记录最终还是要写在预定表中。
物化冲突的方式是很难使用,并且容易出错的,而且还入侵了应用程序的数据模型,并不是一个非常好的方法,一般都作为最后的选择。在通常情况下,使用真正隔离性的优先级要高于物化冲突的方法。
小结
现在我们介绍完了弱隔离性的4种方法,分别是Read committed,snapshot isolation,preventing lost updates和write skew/phantoms,它们之前有一定的递进关系,因此需要先掌握这几种方法的产生和解决问题的脉络,能够帮助我们理解它们的含义。