1.概念
- zookeeper是一个类似hdfs的树形文件结构,zookeeper可以用来保证数据在(zk)集群之间的数据的事务性一致。
- 基于ZAB算法(原子消息广播协议)
- 保证分布式环境中数据一致性
- 两个作用:存储数据、监听事件
- zookeeper有watch事件,是一次性触发的,当watch监视的数据发生变化时,通知设置了该watch的client,即watcher。
- zookeeper有三个角色:Learner,Follower,Observer
2.zookeeper应用场景
- 统一命名服务(Name Service)
- 配置管理(Configuration Management)
机器的配置列表、运行时的开关配置、数据库配置信息等,具有以下特点:- 数据量比较小
- 数据内容在运行时发生变化
- 集群中各节点共享信息,配置一致
- 集群管理(Group Membership)
Leader,实现集群容错功能,具有以下特点:- 希望知道集群中有多少机器在工作
- 对集群中每天运行状态进行数据收集
- 对集群中每个节点进行上下线操作
- 共享锁(Locks):分布式锁
- 队列管理
- 发布/订阅:分布式数据的发布与订阅
- 数据库切换:数据库配置
3.特性
3.1可靠性
一旦Zookeeper成功的应用了一个事务,并完成对client的响应,那么Zookeeper内部集群的所有服务器的状态都会是一致的保留下来。
3.2单一视图
由于上面可靠性的保证,使得无论client连接的是ZK集群中的哪个服务器,所看到的数据都是一致的。
3.3顺序一致性
从一个client发起的请求,最终会严格的按照发起的顺序被应用到Zookeeper中去。【实质上,ZK会对每一个client的每一个请求,进行编号,说白了,就是分配一个全局唯一的递增编号,这个编号反映了所有事务操作的先后顺序。】
3.4实时性
通常意义下的实时性是指一旦事务被成功应用,那么client会立刻从服务器端获取到变更后的新数据。ZK仅仅能够保证在一定时间内,client最终一定会能从服务器上获取到最新的数据。
3.5高可用
在ZK集群内部,会有一个Leader,多个Follower。一旦Leader挂掉,那么ZK会通过Paxos算法选举出新的Leader,只要ZK集群内部的服务器有一半以上正常工作,那么ZK就能对外正常提供服务!
3.6简单的数据结构
类似于Linux文件系统的树形结构,简单,实用!(树形层次空间)
3.7高性能
性能有多高呢,举个栗子,比如我们经常通过创建临时节点来处理分布式锁,要知道临时节点是存储在内存中的,在读场景压力测试下,QPS高达10W+!也就是说ZK在读场景下,性能非常突出!
4.zookeeper的Watcher:一次性、客户端串行执行、轻量
4.1一次性
对于ZK的watcher,只需要记住:zookeeper有watch事件,是一次性触发的,当watch监视的数据发生变化时,通知设置了该watch的client,即watcher,由于zookeeper的监控都是 一次性的,所以每次都必须设置监控。
4.2客户端串行执行
客户端Watcher回调的过程是一个串行同步的过程,这为我们保证了顺序,开发人员需要注意,千万不要因为一个Watcher的处理逻辑影响了整个客户端的Watcher回调
4.3轻量
WatchedEvent是zookeeper整个Watcher通知机制的最小通知单元,只包含三个部分:通知状态、事件类型、节点路径。只会告诉客户端发生了事件,不会告知其内容,需要客户端自己去获取,比如NodeDataChanged事件,Zookeeper只会通知客户端指定节点发生了变更,不会直接提供具体的数据内容