Zookeeper学习系列【三】Zookeeper 集群架构、读写机制以及一致性原理(ZAB协议)

前言

同学们，在上一章中，我们主要讲了Zookeeper两种启动模式以及具体如何搭建。本章内容主要讲的是集群相关的原理内容，第一章可以当做是Zookeeper原理篇的基础部分，本章则是Zookeeper原理篇进阶部分，有关于Zookeeper集群的读写机制、ZAB协议的知识解析。

本篇的内容主要包含以下几点：

Zookeeper 集群架构
Zookeeper 读写机制
ZAB协议
关于Zookeeper 集群的一些其他讨论
- Zookeeper（读性能）可伸缩性和 Observer节点
- Zookeeper 与 CAP 理论
- Zookeeper 作为服务注册中心的局限性

一、Zookeeper 集群架构

接下来我们来说一说Zookeeper的集群架构。

image

Zookeeper 集群中的角色

第一章提过，Zookeeper中，能改变ZooKeeper服务器状态的操作称为事务操作。一般包括数据节点创建与删除、数据内容更新和客户端会话创建与失效等操作。

Leader 领导者 ：Leader 节点负责Zookeeper集群内部投票的发起和决议（一次事务操作），更新系统的状态；同时它也能接收并且响应Client端发送的请求。
Learner 学习者
- Follower 跟随者 ： Follower 节点用于接收并且响应Client端的请求，如果是事务操作，会将请求转发给Leader节点，发起投票，参与集群的内部投票，
- Observer 观察者：Observer 节点功能和Follower相同，只是Observer 节点不参与投票过程，只会同步Leader节点的状态。
Client 客户端

Zookeeper 通过复制来实现高可用。在上一章提到的集群模式（replicated mode）下，以Leader节点为准，Zookeeper的ZNode树上面的每一个修改都会被同步（复制）到其他的Server 节点上面。

上面实际上只是一个概念性的简单叙述，在看完下文的读写机制和ZAB协议的两种模式之后，你就会对这几种角色有一个更加深刻的认识。

二、Zookeeper 读写机制

读写流程

下图就是集群模式下一个Zookeeper Server节点提供读写服务的一个流程。

image

如上图所示，每个Zookeeper Server节点除了包含一个请求处理器来处理请求以外，都会有一个内存数据库(ReplicatedDatabase) 用于持久化数据。ReplicatedDatabase 包含了整个Data Tree。

来自于Client的读服务（Read Requst），是直接由对应Server的本地副本来进行服务的。

至于来自于Client的写服务（Write Requst），因为Zookeeper要保证每台Server的本地副本是一致的（单一系统映像），需要通过一致性协议（后文提到的ZAB协议）来处理，成功处理的写请求（数据更新）会先序列化到每个Server节点的本地磁盘（为了再次启动的数据恢复）再保存到内存数据库中。

image

集群模式下，Zookeeper使用简单的同步策略，通过以下三条基本保证来实现数据的一致性：

全局串行化所有的写操作

串行化可以把变量包括对象,转化成连续bytes数据. 你可以将串行化后的变量存在一个文件里或在网络上传输. 然后再反串行化还原为原来的数据。
保证同一客户端的指令被FIFO执行（以及消息通知的FIFO）

FIFO -先入先出

自定义的原子性消息协议

简单来说，对数据的写请求，都会被转发到Leader节点来处理，Leader节点会对这次的更新发起投票，并且发送提议消息给集群中的其他节点，当半数以上的Follower节点将本次修改持久化之后，Leader 节点会认为这次写请求处理成功了，提交本次的事务。

乐观锁

Zookeeper 的核心思想就是，提供一个非锁机制的Wait Free 的用于分布式系统同步的核心服务。其核心对于文件、数据的读写服务，并不提供加锁互斥的服务。

但是由于Zookeeper的每次更新操作都会更新ZNode的版本（详见第一章），也就是客户端可以自己基于版本的对比，来实现更新数据时的加锁逻辑。例如下图。

image

就像我们更新数据库时，会新增一个version字段，通过更新前后的版本对比来实现乐观锁。

三、ZAB协议

终于到了ZAB协议，讲述完ZAB协议，大家对Zookeeper的一些特性会有更深的体会，对本文的其他内容也会有更透彻的理解。

ZAB 协议是为分布式协调服务ZooKeeper专门设计的一种支持崩溃恢复的一致性协议，这个机制保证了各个server之间的同步。全称 Zookeeper Atomic Broadcast Protocol - Zookeeper 原子广播协议。

两种模式

Zab协议有两种模式，它们分别是恢复模式和广播模式。

广播模式

广播模式类似于分布式事务中的 Two-phase commit （两阶段式提交），因为Zookeeper中一次写操作就是被当做一个事务，所以这实际上本质是相同的。

image

在广播模式，一次写请求要经历以下的步骤

ZooKeeper Server接受到Client的写请求
写请求都被转发给Leader节点
Leader节点先将更新持久化到本地
Leader节点将此次更新提议(propose)给Followers，进入收集选票的流程
Follower节点接收请求，成功将修改持久化到本地，发送一个ACK给Leader
Leader接收到半数以上的ACK时，Leader将广播commit消息并在本地deliver该消息。
当收到Leader发来的commit消息时，Follower也会deliver该消息。

广播协议在所有的通讯过程中使用TCP的FIFO信道，通过使用该信道，使保持有序性变得非常的容易。通过FIFO信道，消息被有序的deliver。只要收到的消息一被处理，其顺序就会被保存下来。

但是这种模式下，如果Leader自身发生了故障，Zookeeper的集群不就提供不了写服务了吗？这就引入了下面的恢复模式。

恢复模式

简单点来说，当集群中的Leader故障或者服务启动的时候，ZAB就会进入恢复模式，其中包括Leader选举和完成其他Server和Leader之间的状态同步。

NOTE：选主是ZAB协议中最为重要和复杂的过程。这里面的概念知识较多，放在本章一起讲反而不利于理解本章的知识，所以我打算在下一章单独介绍，同学们可以选择性地食用。

关于Zookeeper 集群的一些其他讨论

1. Zookeeper（读性能）可伸缩性和 Observer节点

一个集群的可伸缩性即可以引入更多的集群节点，来提升某种性能。Zookeeper实际上就是提供读服务和写服务。在最早的时候，Zookeeper是通过引入Follower节点来提升读服务的性能。但是根据我们之前学习过的读写机制和ZAB协议的内容，引入新的Follower节点，会造成Zookeeper 写服务的下降，因为Leader发起的投票是要半数以上的Follower节点响应才会成功，你Follower多了，就增加了协议中投票过程的压力，可能会拖慢整个投票响应的速度。结果就是，Follower节点增加，集群的写操作吞吐会下降。

在这种情况下，Zookeeper 在3.3.3版本之后，在集群架构中引入了Observer角色，和Follower唯一的区别的就是不参与投票不参与选主。这样既提升了读性能，又不会影响写性能。

另外提一句，Zookeeper的写性能是不能被扩展的，这也是他不适合当做服务注册发现中心的一个原因之一，在服务发现和健康监测场景下，随着服务规模的增大，无论是应用频繁发布时的服务注册带来的写请求，还是刷毫秒级的服务健康状态带来的写请求，都会Zookeeper带来很大的写压力，因为它本身的写性能是无法扩展的。后文引的文章会详细介绍。

2. Zookeeper 与 CAP 理论

分布式领域中存在CAP理论：

C：Consistency，一致性，数据一致更新，所有数据变动都是同步的。
A：Availability，可用性，系统具有好的响应性能。
P：Partition tolerance，分区容错性。以实际效果而言，分区相当于对通信的时限要求。系统如果不能在时限内达成数据一致性，就意味着发生了分区的情况，必须就当前操作在C和A之间做出选择，也就是说无论任何消息丢失，系统都可用。

CAP 定理的含义 -- 阮一峰

该理论已被证明：任何分布式系统只可同时满足两点，无法三者兼顾。因此，将精力浪费在思考如何设计能满足三者的完美系统上是愚钝的，应该根据应用场景进行适当取舍。

根据我们前面学习过的读写机制和ZAB协议的内容，Zookeeper本质应该是一个偏向CP的分布式系统。因为广播协议本质上是牺牲了系统的响应性能的。另外从它的以下几个特点也可以看出。也就是在第一章最后提出的几个特点。

① 顺序一致性
从同一个客户端发起的事务请求，最终将会严格按照其发起顺序被应用到ZooKeeper中。

② 原子性
所有事务请求的结果在集群中所有机器上的应用情况是一致的，也就是说要么整个集群所有集群都成功应用了某一个事务，要么都没有应用，一定不会出现集群中部分机器应用了该事务，而另外一部分没有应用的情况。

③ 单一视图
无论客户端连接的是哪个ZooKeeper服务器，其看到的服务端数据模型都是一致的。

④ 可靠性
一旦服务端成功地应用了一个事务，并完成对客户端的响应，那么该事务所引起的服务端状态变更将会被一直保留下来，除非有另一个事务又对其进行了变更。

3. Zookeeper 作为服务注册中心的局限性

直接引一篇阿里中间件的文章吧，讲的比我好。实际在生产情况下，大多数公司没有达到像大公司那样的微服务量级，Zookeeper是完全能满足服务注册中心的需求的。

阿里巴巴为什么不用 ZooKeeper 做服务发现？

总结

本章主要介绍了Zookeeper的集群架构，详述了ZK的几种角色和组件，还介绍了Zookeeper的读写机制和最核心的ZAB协议，最后对其他一些比较杂的知识点统一归在一起讨论了一下。

本章的知识我本人认为信息量还是蛮大的，整理完之后我自己对Zookeeper集群服务的机制原理有了更深的体会。阅读时最好能够结合第一章的一些基础概念，这样更有助于理解，让知识点前后呼应。希望能对你理解Zookeeper起到帮助。

下一章我会详细介绍本章未介绍的Zookeeper选主过程(Leader Election)。

参考

[1] <https://zookeeper.apache.org/doc/r3.4.13/zookeeperInternals.html#sc_atomicBroadcast 官方文档

[2] 阿里巴巴为什么不用 ZooKeeper 做服务发现？

[3] https://www.cnblogs.com/sunddenly/p/4138580.html

[4] CAP 定理的含义 -- 阮一峰

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 211,265评论 6赞 490
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,078评论 2赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 156,852评论 0赞 347
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,408评论 1赞 283
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,445评论 5赞 384
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,772评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,921评论 3赞 406
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,688评论 0赞 266
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,130评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,467评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,617评论 1赞 340
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,276评论 4赞 329
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,882评论 3赞 312
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,740评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,967评论 1赞 265
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,315评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,486评论 2赞 348

Zookeeper学习系列【三】Zookeeper 集群架构、读写机制以及一致性原理(ZAB协议)

前言

一、Zookeeper 集群架构

Zookeeper 集群中的角色

二、Zookeeper 读写机制

读写流程

乐观锁

三、ZAB协议

两种模式

广播模式

恢复模式

关于Zookeeper 集群的一些其他讨论

1. Zookeeper（读性能）可伸缩性 和 Observer节点

2. Zookeeper 与 CAP 理论

3. Zookeeper 作为 服务注册中心的局限性

总结

参考

推荐阅读更多精彩内容

1. Zookeeper（读性能）可伸缩性和 Observer节点

3. Zookeeper 作为服务注册中心的局限性