zookeeper集群

zookeeper有两种工作模式,一种是单机方式,另一种是集群方式.

Zookeeper作为一个服务，它本身也可能发生故障，所以我们需要将Zookeeper进行集群，避免单点故障问题，以保证zookeeper本身的高可用性

Zookeeper集群特点
Zookeeper集群有三个角色，一个leader（领导者），一个follower（跟随者），一个observer（观察者）；
集群中只要有超过半数的机器是正常工作的，那么整个集群对外就是可用的；
也就是说如果有2个zookeeper，那么只要有1个故障了，zookeeper就不能用了，因为1没有过半，所以2个zookeeper不是高可用的，因为不能容忍任何1台发生故障；

zookeeper集群配置
1、下载安装3个Zookeeper
2、3个zookeeper中conf目录下的zoo_sample.cfg复制一份，改为zoo.cfg并配置：
dataDir=/usr/local/apache-zookeeper-3.5.5-bin-01/data
clientPort=2181

server.1=localhost:2888:3888
server.2=localhost:2889:3889
server.3=localhost:2890:3890

如果是在三个linux上搭建：（端口可以重复）
server.1=linux1IP:2888:3888
server.2=linux2IP:2888:3888
server.3=linux3IP:2888:3888

zookeeper内嵌的server服务器的端口，默认是8080

admin.serverPort=3181

格式：
server.A = B：C：D：
server.serverid = serverhost:leader_listent_port:quorum_port
A是一个数字,表示这个是第几号服务器,
B是这个服务器的ip地址
C该端口用于集群成员的信息交换,表示的是该服务器与集群中的Leader服务器交换信息的端口
D是在leader挂掉时专门用来进行选举leader端口
3、创建三个dataDir目录
/usr/local/apache-zookeeper-3.5.5-bin-01/data
/usr/local/apache-zookeeper-3.5.5-bin-02/data
/usr/local/apache-zookeeper-3.5.5-bin-03/data
每个data目录中都创建一个名为myid的文件，3个文件的内容分别写1、2、3；
如果你这个dataDir目录下有原来运行产生的数据，最好是删除一下；
这个1、2、3是对应前面的server.1、 server.2、 server.3
至此一个zookeeper的集群就搭建完成；
注：admin.serverPort=3181 （zookeeper从3.5.x版本开始会占用8080端口，通过此配置修改掉默认的8080，避免和tomcat端口冲突）
验证集群：
./zkServer.sh status
Mode: leader
Mode: follower

zookeeper集群选举leader

Leader选举是保证分布式数据一致性的关键所在，当Zookeeper集群中的一台服务器出现以下两种情况之一时，需要进入Leader选举。
(1) 服务器初始化启动的时候；
(2) 服务器运行期间无法和Leader保持连接；

下面就两种情况进行分析讲解。
1、服务器启动初始化的时候Leader选举
进行Leader选举的基础条件是至少需要有两个zookeeper，下面我们以3台机器组成的zookeeper集群为例。
在集群初始化阶段，当有一台服务器zookeeper1启动时，其单独无法进行和完成Leader选举；
当第二台服务器zookeeper2启动时，此时两台机器(超过半数)可以相互通信，每台机器都试图找到Leader，于是进入Leader选举过程，选举过程如下：
(1) 每个zookeeper发出一个投票，由于是启动初始情况，zookeeper1和zookeeper2都会将自己作为Leader服务器来进行投票，每次投票会包含所推选的服务器的myid和ZXID，使用 (ZXID,myid) 来表示，此时zookeeper1的投票为 (0, 1)，zookeeper2的投票为 (0, 2)，然后各自将这个投票信息发送给集群中其他机器。
(2) 集群的每个服务器收到投票后，首先判断该投票的有效性，如检查是否是本轮投票、是否来自LOOKING状态的服务器。
LOOKING
寻找leader状态
当前服务器处于该状态时，它会认为当前集群中没有leader，因此需要进入leader选举状态。
FOLLOWING
跟随者状态
表示当前服务器的角色是Follower角色
LEADING
领导者状态
表示当前服务器是Leader
OBSERVING
观察者状态
表示当前服务器角色是Observer；
(3) 处理投票，针对每一个投票，服务器都需要将别人的投票和自己的投票进行PK，PK规则如下：
优先检查ZXID，ZXID比较大的服务器优先作为Leader；（相等，都是0）
如果ZXID相同，那么就比较myid，myid大的服务器作为Leader服务器；

对于zookeeper1而言，它的投票是 (0, 1)，接收zookeeper2的投票为 (0, 2,)，首先会比较两者的ZXID，均为0，再比较myid，此时zookeeper2的myid最大，zookeeper2成为leader，同时每个zookeeper更新自己的投票为 (0,2)，然后重新投票，对于zookeeper2而言，其无须更新自己的投票，只是再次向集群中所有机器发送上一次投票信息即可；

(4) 统计投票，每次投票后，服务器都会统计投票信息，判断是否已经有过半机器接受到相同的投票信息，对于zookeeper1、zookeeper2而言，都统计出集群中已经有两台机器接受了 (0,2) 的投票信息，此时便认为已经选出了Leader；
(5) 改变服务器状态，一旦确定了Leader，每台服务器就会更新自己的状态，如果是Follower，那么就变更为FOLLOWING，如果是Leader，就变更为LEADING。

2、服务器运行期间的Leader选举
在Zookeeper运行期间，Leader与非Leader服务器各司其职，如果有非Leader服务器宕机或新加入，此时不会影响Leader，但是一旦Leader服务器宕机，那么整个集群将暂停对外服务，进入新一轮Leader选举，其过程和启动时期的Leader选举过程基本一致；假设正在运行的有zookeeper1、zookeeper2、zookeeper3三台服务器，当前Leader是zookeeper2，若某一时刻Leader宕机了，此时便开始Leader选举，选举过程如下：
(1) 变更状态，Leader宕机后，余下的服务器都会将自己的服务器状态变更为LOOKING，然后开始进入Leader选举过程；
(2) 每个zookeeper会发出一个投票，在运行期间，每个服务器上的ZXID可能不同，此时假定zookeeper1的ZXID为128，zookeeper3的ZXID为127；在第一轮投票中，zookeeper1和zookeeper3都会将票投给自己，产生投票(128, 1)，(127, 3)，然后各自将投票发送给集群中其他机器；
(3) 接收来自各个服务器的投票，与自己的投票进行比较，此过程与启动时相同；
(4) 处理投票，与启动时过程相同，此时（zookeeper1将会成为Leader）；
(5) 统计投票，与启动时过程相同。
(6) 改变服务器的状态，与启动时过程相同。

Zookeeper有三个角色：领导者、跟随者、观察者，不同角色来执行不同的任务。
首先梳理几个概念：

事务请求：
在zk中，那些会改变服务器状态的请求称为事务请求（创建节点、更新数据、删除节点、创建会话等等）
非事务请求
从zk读取数据，但是不对状态进行任何修改的请求称为非事务请求；

leader角色:
leader服务器是zk集群工作的核心,其主要工作有两个,
1.事务请求的唯一调度者和处理者,保证集群事物处理的顺序性.
2.集群内部各个服务器的调度者

Follower是zk集群的跟随者，其主要工作有三个：

处理客户端非事务性请求，转发事务请求给Leader服务器（事务请求都由Leader处理）
参与事务请求的投票 (同步master事物操作,做出回馈,master只有接收到半数以上的回馈投票才认为该事物操作,执行成功,此时的回馈投票就是事物投票)
参与Leader选举投票

Observer充当观察者角色；Observer观察者是另一种跟随者；

观察zk集群的最新状态变化并将这些状态同步过来;
对于非事务请求可以进行独立的处理，对于事务请求，则会转发给Leader服务器进行处理;
Observer不会参与任何形式的投票，包括事务请求的投票和Leader选举的投票；

如何配置observer模式？
在任何想变成observer模式的配置文件中加入如下配置：
peerType=observer
并在所有server的配置文件中，配置成observer模式的server的那行配置追加:observer，例如：
peerType=observer
server.1=localhost:2888:3888
server.2=localhost:2889:3889
server.3=localhost:2890:3890
server.4=localhost:2891:3891:observer

为什么有Observer角色
我们知道ZooKeeper的ZNode变更是要过半数投票通过，随着机器的添加，因为网络消耗等原因必定导致投票成本增加，从而导致写性能的下降。
Observer是一种新型的ZooKeeper节点，能够帮助解决上述问题，提供ZooKeeper的可扩展性。Observer不參与投票，仅仅是简单的接收投票结果。因此我们添加再多的Observer，也不会影响集群的写性能。除了这个区别，其它的和Follower基本上全然一样。比如：Client都能够连接到他们（Observer），而且都能够发送读写请求给他们，收到写请求都会上报到Leader。
Observer有另外一个优势，由于它不參与投票，所以他们不属于ZooKeeper集群的关键部位，即使他们Failed，或者从集群中断开，也不会影响集群的可用性。

zookeeper监控与运维
在zoo.cfg文件最下面加上如下配置开启四字命令白名单：
4lw.commands.whitelist=stat, ruok, conf
或者
4lw.commands.whitelist=* --所有4字命令都可以用
（1）输出server的详细配置信息，（如果没有nc，需要安装：yum install nc -y）
echo conf | nc localhost 2181

image.png

（2）输出指定server上所有客户端连接的详细信息，包括连接信息的总览，连接ip、端口号、该连接的发包数、该连接的收包数、连接的session Id、最后操作方式/命令、连接的时间戳、超时时间（未确认）、最后的zxid、最后、响应时间戳、连接的时间延时信息等；
echo cons | nc localhost 2181

image.png

（3）功能性命令，重置所有连接的统计信息
echo crst | nc localhost 2181

image.png

（4）输出所有等待队列中的会话和临时节点的信息，这个命令针对Leader执行；
echo dump | nc localhost 2181

image.png

（5）输出server简要状态和连接的客户端信息
echo stat | nc localhost 2181

image.png

（6）列出所有watcher信息，以watcher的session为归属单元排列，列出该会话订阅了哪些path；
echo wchc | nc localhost 2181

image.png

（7）输出一些ZK运行时信息,版本、延时、收包、发包、连接数、未完成客户端请求数、leader/follower 状态、znode 数、watch 数、临时节点数、近似数据大小应该是一个总和的值、打开文件描述符数、最大文件描述符数、fllower数等等；

image.png

Zookeeper服务监控

公司有zookeeper的集群环境，如何在线监控，淘宝针对监控Zookeeper的推出的一个开源项目TaoKeeper，不过很久没有更新了；

下载地址：https://github.com/alibaba/taokeeper/downloads

image.png

部署步骤
1.数据库准备
下载taokeeper.sql,初始化mysql数据库;
2.部署程序
下载taokeeper-monitor.tar.gz包，然后解压到tomcat的webapp下;
3.配置文件设置
taokeeper-monitor-config.properties存放到指定路径，比如：tomcat /webapp/项目/taokeeper-monitor-config.properties

image.png

4.Tomcat启动配置

catalina.sh配置（配置在第一行即可）

JAVA_OPTS=”-DconfigFilePath="配置文件路径taokeeper-monitor-config.properties”

浏览器访问：http://192.168.10.128:8080/taokeeper-monitor

image.png

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 199,830评论 5赞 468
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 83,992评论 2赞 376
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 146,875评论 0赞 331
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 53,837评论 1赞 271
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 62,734评论 5赞 360
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,091评论 1赞 277
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,550评论 3赞 390
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,217评论 0赞 254
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,368评论 1赞 294
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,298评论 2赞 317
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,350评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,027评论 3赞 315
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,623评论 3赞 303
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,706评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 30,940评论 1赞 255
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,349评论 2赞 346
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 41,936评论 2赞 341

zookeeper集群

zookeeper内嵌的server服务器的端口，默认是8080

推荐阅读更多精彩内容