前言
Zookeeper为了保证各节点的协同工作,在工作时需要一个Leader角色,而Zookeerper默认采用FastLeaderElection算法,且投票数大于半数则胜出的机制。
相关概念
-
服务器ID
这是在配置集群时设置的myid参数文件,且参数分别表示为服务器1、服务器2、服务器3,编号越大在FastLeaderElection算法的权重越大。 -
选举状态
在选举过程中,Zookeeper服务器有四种状态,它们分别为竞选状态(Looking)、随从状态(Following,同步leader状态,参与投票)、观察状态(Observing,同步不leader状态,不参与投票)、领导者状态(Leader)。 -
数据id
是服务器中存放的最新数据版本号,该值越大则说明数据越新,在选举过程中数据越新权重越大。 -
逻辑时钟
通俗的讲,逻辑时钟被称为投票次数,同一轮投票过程中的逻辑时钟值是相同的,逻辑时钟起始值为0,每投一次票,这个数据就会增加。如果某台机器宕机,那么这台机器不会参与投票,因此逻辑时钟会比其他的低。
选举机制类型
Zookeeper选举机制有两种类型,分别为全新集群选举和非全新集群选举,下面分别对两种类型进行详细讲解。
全新集群选举
全新集群选举是新建搭建起来的,没有数据ID和逻辑时钟的数据影响集群的选举。假设,目前有5台服务器,它们的编号分别是1-5,按编号依次启动Zoopeer服务,以下是全过程。
- 步骤1:服务器1启动,首先,会给自己投票;其次,发投票信息。由于其他机器还没有启动所以它无法收到投票的反馈信息,因此服务器1的状态一直属于Looking状态。
- 步骤2:服务器2的启动,首先,会给自己投票;其次在集群中启动的zookeeper服务的机器发起投票对比,这时它会与服务器1交换结果,由于服务器2的编号大,所以服务器2胜出,此时服务器1会将票投给服务器2,但此时服务器2的投票数并没有大于集群半数(2<5/2),所以两个服务器的状态依然是Looking状态。
- 步骤3:服务器3启动,首先会给自己投票;其次,与之前启动的服务器1、2交换信息 ,由于服务器3的编号最大所以服务器3胜出,那么服务器1、2会将票投给服务器3,此时投票数正好大于半数(3>5/2),所以服务器3成为领导者状态,服务器1、2称为追随者状态。
- 步骤4:服务器4启动,首先,给自己投票;其次,与之前启动的服务器1、2、3交换信息,尽管服务器4的编号大,但是服务器3已经胜出,所以服务器4只能成为追随者状态。
- 步骤5:服务器5启动,同服务器4一样,均成为追随者状态。
非全新集群选举
对于正常运行的Zookeeper集群,-一旦中途有服务器宕机,则需耍重新选举时,选举的过程中就需要引入服务器ID、数据ID和逻辑时钟。这是由于Zookeeper集群已经运行过一-段时间,那么服务器中就会存在运行的数据。下面来讲解非全新集群选举的过程。
- 步骤1:首先,统计逻辑时钟是否相同,逻辑时钟小,则说明途中可能存在宕机问题,因此数据不完整,那么该选举结果被忽略,重新投票选举;
- 步骤2:步骤2:其次,统- -逻辑时钟后,对比数据ID值,数据ID反应数据的新旧程度,因此数据ID大的胜出:
- 步骤3:步骤3:如果逻辑时钟和数据ID都相同的情况下,那么比较服务器以(编号),值大则胜出。
简单的讲,非全新集群选举时是优中选优,保证Leader是Zookeeper集群中数据最完整的