CAP 定理,又被称为 布鲁尔定理,指出对于一个分布式计算系统来说,不可能同时满足以下三点:
一致性(*C**onsistency*)
所有节点都能访问同一份最新的数据副本
三种一致性策略
对于关系型数据库,要求更新过的数据能被后续的访问都能看到,这是强一致性。
如果能容忍后续的部分或者全部访问不到,则是弱一致性。
如果经过一段时间后要求能访问到更新后的数据,则是最终一致性。
CAP中说,不可能同时满足的这个一致性指的是 强一致性。
可用性(*A**valiablity*)
每次请求都能获取到非错的响应,但是不保证获取的数据为最新数据,服务一直可用且是正常响应时间。
对于一个可用性的分布式系统,每一个非故障的节点必须对每一个请求作出响应。所以,一般我们在衡量一个系统的可用性的时候,都是通过停机时间来计算的。
| 可用性分类 | 可用水平(%) | 年可容忍停机时间 |
| :————————–: | :———–: | :————–: |
| 容错可用性 | 99.9999 | <1 min |
| 极高可用性 | 99.999 | <5 min |
| 具有故障自动恢复能力的可用性 | 99.99 | <53 min |
| 高可用性 | 99.9 | <8.8h |
| 商品可用性 | 99 | <43.8 min |好的可用性主要是指系统能够很好的为用户服务,不出现用户操作失败或者访问超时等用户体验不好的情况。一个分布式系统,上下游设计很多系统如负载均衡、WEB服务器、应用代码、数据库服务器等,任何一个节点的不稳定都可以影响可用性。
分区容错性(*P**artition tolerance*)
分布式系统在某节点或网络分区故障的时候,仍然能够堆外提供满足一致性和可用性的服务
以实际效果而言,分区相当于对通信的时限要求。系统如果不能在时限内达成数据一致,就意味着发生了分区的情况,必须就当前操作在 C 和 A 之间做出选择。
根据定理,分布式系统只能满足三项中的两项而不可能满足全部三项。
理解CAP理论的最简单方式是想象两个节点分处分区两侧。允许至少一个节点更新状态会导致数据不一致,即丧失了C性质。如果为了保证数据一致性,将分区一侧的节点设置为不可用,那么又丧失了A性质。除非两个节点可以互相通信,才能既保证C又保证A,这又会导致丧失P性质。
参考资料: