如果我们期待实现一套严格满足ACID(Atomicity原子性、Consistency一致性、Isolation隔离性、Durability持久性)的分布式事务,很可能的情况就是系统的可用性和严格一致性出现冲突。在可用性和一致性之间永远无法存在一个两全其美的方案。
CAP定理
2000年7月,加州大学伯克利分校Eric Brewer教授提出了著名的CAP猜想。2年后,来自麻省理工学院的Seth Gilbert和Nancy Lynch从理论上证明了CAP,从此CAP定理成为了分布式计算领域公认的定理。
CAP理论告诉我们:一个分布式系统不可能同时满足一致性(C:Consistency)、可用性(A:Availability)、分区容错性(P:Partition tolerance)这三个基本需求,并且最多只能满足其中的两项。
CAP猜想:http://www.cs.berkeley.edu/~brewer/cs262b-2004/PODC-keynote.pdf
CAP证明:http://lpd.epfl.ch/sgilbert/pubs/BrewesConjecture-SigAct.pdf
对于一个分布式系统来说,分区容错是基本需求否则不能称为分布式系统。因此架构师需要在C和A之间寻求平衡。
Base理论
Base = Basically Available+Soft state+Eventually consistent 基本可用性+软状态+最终一致性,由eBay架构师Dan Pritchett提出。Base是对CAP中一致性和可用性权衡的结果,源于提出者自己在大规模分布式系统上实践的总结。核心思想是无法做到强一致性,但每个应用都可以根据自身的特点,采用适当方式达到最终一致性。
基本可用:可响应时间可损失、可功能损失。
软状态:允许系统数据存在中间状态,但不会影响到系统的整体可用性,即允许系统在不同节点的数据副本之间进行数据同步时存在延时。
最终一致性:要求系统数据副本最终能够一致,而不需要实时保证数据副本一致。
最终一致性有5个变种:因果一致性、读己之所写(因果一致性特例)、会话一致性、单调读一致性、单调写一致性。在实际系统实践中,可以将若干变种结合起来。