CAP定理(布鲁尔定理)及BASE理论
CAP定义
CAP定理,计算机科学中有称布鲁尔定理,由加州大学的计算机科学家Eric Brewer (埃里克.布鲁尔)于1998年提出,他指出对于一个分布式系统来说,不可能同时满足以下三点:一致性(Consistency),可用性(Availability),分区容错性(Partition tolerance).CAP即三个指标的首字母.
一致性(Consistency)
CAP定理的一致性指的是强一致性,意思是分布式服务中每个节点访问同一份最新数据副本,即指在任何一个节点完成写操作后,所有节点读操作返回的值都是写操作的结果.也就是说,在一致性的系统中,一旦一个客户端将值写入服务器并得到响应,那么之后任何客户端从任何服务器读取的都是刚写入的数据.
可用性(Availability)
系统中的非故障节点收到的每个请求都必须有响应,可用性系统中,只要服务器没有整体崩溃,最终就必须要响应任何客户端的请求,不允许服务器忽略客户端的请求,不然就不满足可用性.就是说,服务必须一直可用,而且是正常响应时间.
分区容错性(Partition tolerance)
分区容错指,容许节点之间因为各种原因导致的消息传递的差错(延迟或者丢失),从而不影响服务的正常提供.分布式系统中必须要满足CAP中的P,因此只能在C/A中做取舍.
一致性和可用性的矛盾性
若要保证一致性:则必须进行节点之间的数据同步操作,同步操作必然要对同步期间的数据锁定,这样则会导致同步期间的数据读取失败或者超时,就不能满足可用性
若要保证可用性:则必须要保证服务一直可用,则不允许同步期间数据的锁定,就无法满足一致性
CAP三者权衡
CP
舍弃可用性,这样的系统需要保证大多数节点的数据一致,少数节点会因为数据同步时的数据锁定而无法提供服务.
CA
舍弃分区容错性,这意味着你的系统已经不是一个分布式系统,而是一个单点系统.
AP
舍弃一致性,意味这你的系统允许在并发访问下数据不一致的情况.像我们网上买火车票时,本来你看到刚好还有一张票,但其实这个时候这张票已经卖出去了,你填好信息准备购买时,系统提示没票了.这就是牺牲了一致性.
BASE理论
BASE全称:Basically Available(基本可用),Soft state(软状态),和 Eventually consistent(最终一
致性)三个短语的缩写,来自 ebay(线上拍卖购物平台) 的架构师提出。BASE是对CAP定理中可用性和一致性权衡的结果,是基于CAP定理逐渐演化而来.其核心思想是:即使无法做到强一致性,但根据每个业务的特点,采用适当的方式来使系统达到最终一致性.
Basically Available(基本可用)
基本可用是指分布式系统在出现不可预知的故障时,允许损失部分可用性,但这不以为着系统不可用.以下是基本可用的两个典型例子
1).响应时间上的损失:正常情况下, 一个在线搜索引擎需要0.5秒内返回给用户相应的查询结果,但由于出现异常(比如系统部分机房发生断电或断网故障),查询结果的响应时间增加到了1~2秒。
2). 功能上的损失:正常情况下,在一个电子商务网站上进行购物,消费者几乎能够顺利地完成每一笔订单,但是在一些节日大促购物高峰的时候,由于消费者的购物行为激增,为了保护购物系统的稳定性,部分消费者可能会被引导到一个降级页面。
Soft state(软状态)
软状态也指弱状态, 是指允许系统中的数据存在中间状态,并认为该中间状态的存在不会影响系统的整体可用性,即允许系统在不同节点的数据副本之间进行数据听不的过程存在延时。
Eventually consistent(最终一 致性)
最终一致性强调的是系统中所有的数据副本,在经过一段时间的同步后,最终能够达到一个一致的状态。因此,最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性