1. Eureka的自我保护
默认情况下,如果EurekaServer在一定时间内(默认90秒)没有接收到某个微服务实例的心跳,Eureka Server将会移除该实例。但是当网络分区故障发生时,微服务与Eureka Server之间无法正常通信,而微服务本身是正常运行的,此时不应该移除这个微服务,所以引入了自我保护机制。
自我保护机制的工作机制是如果在15分钟内超过85%的客户端节点都没有正常的心跳,
那么Eureka就认为客户端与注册中心出现了网络故障,Eureka Server自动进入自我保护机制,此时会出现以下几种情况:
(1) Eureka Server不再从注册列表中移除因为长时间没收到心跳而应该过期的服务。
(2) Eureka Server仍然能够接受新服务的注册和查询请求,但是不会被同步到其它节点上,保证当前节点依然可用。
(3) 当网络稳定时,当前EurekaServer新的注册信息会被同步到其它节点中。
因此Eureka Server可以很好的应对因网络故障导致部分节点失联的情况,而不会像ZK(zookeeper)那样如果有一半不可用的情况会导致整个集群不可用而变成瘫痪。
- 配置优化:
// 可开启或者关闭自我保护功能
enable-self-preservation: false
// 配置自我保护阈值
renewal-percent-threshold: 0.85
2. 故障服务快速下线
前面说了,如果EurekaServer在一定时间内没有接收到某个微服务实例的心跳,Eureka Server将会移除该实例。
- 配置优化:
配置这个时间阈值,可以快速剔除掉出现故障的节点:
eviction-interval-timer-in-ms: 30000 // 30s
3. 读取注册表优化
Eureka Server 存在三级缓存来存放服务注册信息:registry、readWriteCacheMap、readOnlyCacheMap。
class AbstractInstanceRegistry:
private final ConcurrentHashMap<String, Map<String, Lease<InstanceInfo>>> registry = new ConcurrentHashMap();
class ResponseCacheImpl:
private final ConcurrentMap<Key, ResponseCacheImpl.Value> readOnlyCacheMap = new ConcurrentHashMap();
private final LoadingCache<Key, ResponseCacheImpl.Value> readWriteCacheMap;
默认情况下定时任务每30s将readWriteCacheMap同步至readOnlyCacheMap,每 60s 清理超过 90s未续约的节点,Eureka Client 每 30s 从 readOnlyCacheMap更新服务注册信息,而服务的注册则在 registry 更新信息。
当存在大规模的服务注册和更新时,如果只是修改 ConcurrentHashMap 里的数据,那么势必因为锁的存在导致竞争,影响性能。
而 Eureka又是AP模型,只需要满足最终可用就行。所以它在这里用到多级缓存来实现读写分离。注册方法写的时候直接写内存注册表,写完表之后主动失效读写缓存。
获取注册信息接口先从只读缓存取,只读缓存没有再去读写缓存取,读写缓存没有再去内存注册表里取。
然而很多实际场景中,很少会有大规模的服务注册与更新。
- 配置优化:
(1)我们可以通过配置,使其在读取注册表的时候直接从readWriteCacheMap中读取,而不用从readOnlyCacheMap去读取。
class ResponseCacheImpl:
if (useReadOnlyCache) {
ResponseCacheImpl.Value currentPayload = (ResponseCacheImpl.Value)this.readOnlyCacheMap.get(key);
if (currentPayload != null) {
payload = currentPayload;
} else {
payload = (ResponseCacheImpl.Value)this.readWriteCacheMap.get(key);
this.readOnlyCacheMap.put(key, payload);
}
} else {
payload = (ResponseCacheImpl.Value)this.readWriteCacheMap.get(key);
}
// 关闭从readOnlyCacheMap读注册表
use-read-only-response-cache: false
(2)减少readWriteCacheMap与readOnlyCacheMap的同步时间,从而让新注册的服务能更快被发现。
// readWrite 和 readOnly 同步时间间隔。
response-cache-update-interval-ms: 10000 // 10s