ZooKeeper概述

1.什么是Zookeeper?

ZooKeeper是一个开放源码的分布式协调服务的 Apache 项目，它是集群的管理者，监视着集群中各个节点的状态根据节点提交的反馈进行下一步合理操作。最终，将简单易用的接口和性能高效、功能稳定的系统提供给用户。

分布式应用程序可以基于Zookeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Leader选举、分布式锁和分布式队列等功能。

Zookeeper保证了如下分布式一致性特性：

顺序一致性

原子性

单一视图

可靠性

实时性（最终一致性）

客户端的读请求可以被集群中的任意一台机器处理，如果读请求在节点上注册了监听器，这个监听器也是由所连接的zookeeper机器来处理。对于写请求，会统一由Leader接收并处理，广播给其他zookeeper机器并且达成一致后，请求才会返回成功。因此，随着zookeeper的集群机器增多，读请求的吞吐会提高但是写请求的吞吐会下降。

有序性是zookeeper中非常重要的一个特性，所有的更新都是全局有序的，每个更新都有一个唯一的时间戳，这个时间戳称为zxid（Zookeeper Transaction Id）。而读请求只会相对于更新有序，也就是读请求的返回结果中会带有这个zookeeper最新的zxid。

2.Zookeeper特性

1、Zookeeper：一个leader，多个follower组成的集群

2、Leader 负责进行投票的发起和决议，更新系统状态。

3、Follower 用于接收客户请求并向客户端返回结果，在选举 Leader 过程中参与投票。

4、集群中只要有半数以上节点存活，Zookeeper 集群就能正常服务。

5、全局数据一致：每个server保存一份相同的数据副本，client无论连接到哪个server，数据都是一致的

6、分布式读写，更新请求转发，由leader实施

7、更新请求顺序进行，来自同一个client的更新请求按其发送顺序依次执行

8、数据更新原子性，一次数据更新要么成功，要么失败

9、实时性，在一定时间范围内，client能读到最新数据

3.Zookeeper数据结构

ZooKeeper 数据模型的结构与 Unix 文件系统很类似，整体上可以看作是一棵树，每个节点称做一个 ZNode。每一个 ZNode 默认能够存储 1MB 的数据，每个 ZNode 都可以通过其路径唯一标识。

1、层次化的目录结构，命名符合常规文件系统规范(类似文件系统）

2、每个节点在zookeeper中叫做znode,并且其有一个唯一的路径标识

3、节点Znode可以包含数据和子节点（但是EPHEMERAL类型的节点不能有子节点）

3.Zookeeper应用场景

提供的服务包括：统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。

统一命名服务

在分布式环境下，经常需要对应用/服务进行统一命名，便于识别不同服务。

（1）类似于域名与ip之间对应关系，ip不容易记住，而域名容易记住。

（2）通过名称来获取资源或服务的地址，提供者等信息。

统一配置管理

一、分布式环境下，配置文件管理和同步是一个常见问题。

（1）一个集群中，所有节点的配置信息是一致的，比如 Hadoop 集群。

（2）对配置文件修改后，希望能够快速同步到各个节点上。

二、配置管理可交由ZooKeeper实现。

（1）可将配置信息写入ZooKeeper上的一个Znode。

（2）各个节点监听这个Znode。

（3）一旦Znode中的数据被修改，ZooKeeper将通知各个节点。

统一集群管理

一、分布式环境中，实时掌握每个节点的状态是必要的。

（1）可根据节点实时状态做出一些调整。

二、可交由ZooKeeper实现。

（1）可将节点信息写入ZooKeeper上的一个Znode。

（2）监听这个Znode可获取它的实时状态变化。

三、典型应用

（1）HBase中Master状态监控与选举。