集群操作如何保证数据一致
拜占庭将军问题:拜占庭将军问题是一个协议问题,拜占庭帝国军队的将军们必须全体一致的决定是否攻击某一支敌军。问题是这些将军在地理上是分隔开来的,并且将 军中存在叛徒。叛徒可以任意行动以达到以下目标:欺骗某些将军采取进攻行动;促成一个不是所有将军都同意的决定,如当将军们不希望进攻时促成进攻 行动;或者迷惑某些将军,使他们无法做出决定。如果叛徒达到了这些目的之一,则任何攻击行动的结果都是注定要失败的,只有完全达成一致的努力才能 获得胜利。
Paxos算法:一种基于消息传递且具有高度容错特性的一致性算法。
• 一个完整的Paxos算法流程分为三个阶段:
Paxos算法流程
案例讲解
有ABCDE五人对公司问题进行决议
第一种情况:
第二种情况:
第三种情况:
ZAB协议
借鉴了Paxos算法,在Paxos基础上,zookeeper设计只有一台客户端(Leader)负责处理外部写事务的请求,在同步到其他节点,即只有一个Leader可以发起提案
消息广播
此时会出现2种情况:
崩溃恢复
选举过后,Zab如何数据同步:
CAP理论
1)一致性(C:Consistency) 在分布式环境中,一致性是指数据在多个副本之间是否能够保持数据一致的特性。在一致性的需求下,当一个系统在数 据一致的状态下执行更新操作后,应该保证系统的数据仍然处于一致的状态。
2)可用性(A:Available) 可用性是指系统提供的服务必须一直处于可用的状态,对于用户的每一个操作请求总是能够在有限的时间内返回结果。
3)分区容错性(P:Partition Tolerance) 分布式系统在遇到任何网络分区故障的时候,仍然需要能够保证对外提供满足一致性和可用性的服务,除非是整个网络 环境都发生了故障
ZooKeeper保证的是CP
持久化
Leader与Follower数据会在内存和磁盘各保存一份,所以需要持久化到磁盘中
磁盘会先进行快照存储,等空闲时在同步到磁盘,根据序列化反序列存储信息
初始化过程