2020/10/178
这次想和大家聊一聊数据库事务。主要是因为前些日子对NewSql比较感兴趣,接触了一些分布式事务算法。但是在这个过程中发现自己对事务的概念和理论基本是缺失的,因此花了一段时间进行了了解。
这个短系列文章主要把关注点放在事务隔离级别上,希望你看完后,对隔离级别的认识不再仅仅是它们的中文翻译(读未提交[read-uncommitted]、读已提交[read-committed]、可重复读[repeatable-read)]、可串行化[serializable]),而是实现者为了系统性能而对隔离性的破坏的认同。而当破坏了隔离性之后,一些异常象限开始出现:脏读,不可重复读,幻读等。
事务的隔离性主要是为了解决数据库并发请求而可能造成的数据不一致,这种不一致主要是由于读-写,写-读,写-写并发冲突引起的(读-读不存在冲突)。面对并发造成的数据不一致问题,通常的解决思路是加锁。例如通过读写锁来避免上述的读写冲突,而这正是早期数据库事务实现的方式(二阶段锁-2PL)。2PL能够提供隔离性(区分隔离性和隔离读的含义,保证隔离性表明实现了可串行化)的保证。虽然2PL能够实现隔离性,但是它是以牺牲并发能力为代价的。为了性能,系统实现者逐步放弃对读-写,写-读,写-写并发的安全性保障,从而引伸出不同的隔离级别(隔离度)。
除了锁之外,copy-on-write技术常常被用于读多写少的并发环境中,基于该思想(还有乐观锁思想),快照隔离(snapshot-isolation[SI])被更多地用于目前流行的数据库中,虽然有些数据库实现并非是完全按照文献[1]。快照隔离在提供了一个不错的隔离度情况下,避免了对读-写,写-读的并发阻塞,因此对读事务非常友好。同时现在的很多分布式关系型数据库(NewSql)也更多得提供快照隔离的隔离度保证[2,3]。
从上面的介绍中我们发现,事务隔离级别似乎并不只有的read-uncommitted、read-committed、repeatable-read、serializable,还有一个SI。这是因为前者四个隔离级别最早是在ANSI SQL-92标准中定义的,而那个时候还没有SI的提出,要直到1995在文献[1]中才被正式提出。令人遗憾的是,SQL-92对事务隔离级别定义的缺陷并不只有这一点, 忽略多个对象的一致性考虑是它被吐槽的主要诟病。这种欠考虑的隔离性(较弱一致性)导致数据库生产商根据自己的理解来强化这些隔离级别的定义,进而导致各个数据库之间隔离级别的实现差异,这些问题在后续文章中会有讨论。正是因为SQL-92定义的不完整,所以后人[1]提供了另一个隔离级别定义的视图:
这个系列文章的其中一个目的是希望你在读完文章后能够看懂这张图。这里可以先简单解释一下,这里的P0,P1...表示的是异常现象,例如脏写,脏读...,read uncommitted, read-commmitted表示事务隔离级别。而这张图的意思是指定隔离级别能够禁止其下方的异常现象发生,但是不能禁止其上方的异常现象发生。其它的我想在看完这个系列文章后,你就自然懂了。除此之外,还会介绍2PL,因此通过2PL来定义隔离级别(部分)是比较清晰的;还会介绍SI,毕竟它已经被广泛应用在主流数据库和分布式数据库中了。最后作为延伸,我还希望能够介绍一些分布式事务算法。大概就是这些了...
参考文献
[1] "A Critique of ANSI SQL Isolation Levels", Hal, 1995
[2] "TiDB: A Raftbased HTAP Database", Dongxu Huang, 2020
[3] "Spanner: Google’s Globally-Distributed Database", google, 2012