1.Hystrix是什么?
hystrix对应的中文名字是“豪猪”,豪猪周身长满了刺,能保护自己不受天敌的伤害,代表了一种防御机制,这与hystrix本身的功能不谋而合,因此Netflix团队将该框架命名为Hystrix,并使用了对应的卡通形象做作为logo。
在一个分布式系统里,许多依赖不可避免的会调用失败,比如超时、异常等,如何能够保证在一个依赖出问题的情况下,不会导致整体服务失败,这个就是Hystrix需要做的事情。Hystrix提供了熔断、隔离、Fallback、cache、监控等功能,能够在一个、或多个依赖同时出现问题时保证系统依然可用。
2.用一个例子快速进入Hystrix
Hystrix的核心功能,就是在调用远程服务时的熔断机制。下面用一个简单的例子来说明Hystrix的核心功能。
1.例子基于spring-boot,所以首先新建一个空的spring-boot项目。建项目的过程此处略过。
2.添加maven依赖:
<dependency>
<groupId>com.netflix.hystrix</groupId>
<artifactId>hystrix-core</artifactId>
<version>1.5.9</version>
</dependency>
<dependency>
<groupId>com.netflix.hystrix</groupId>
<artifactId>hystrix-metrics-event-stream</artifactId>
<version>1.5.9</version>
</dependency>
<dependency>
<groupId>com.netflix.hystrix</groupId>
<artifactId>hystrix-javanica</artifactId>
<version>1.5.9</version>
</dependency>
3.新建configuration类
package com.mogujie.marketing.hystrixTest.configuration;
import com.netflix.hystrix.contrib.javanica.aop.aspectj.HystrixCommandAspect;
import com.netflix.hystrix.contrib.metrics.eventstream.HystrixMetricsStreamServlet;
import org.springframework.boot.web.servlet.ServletRegistrationBean;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
@Configuration
public class HystrixConfiguration {
@Bean
public HystrixCommandAspect hystrixAspect() {
return new HystrixCommandAspect();
}
@Bean
public ServletRegistrationBean hystrixMetricsStreamServlet() {
ServletRegistrationBean registration = new ServletRegistrationBean(new HystrixMetricsStreamServlet());
registration.addUrlMappings("/hystrix.stream");
return registration;
}
}
4.新建RemoteService,代表依赖的远程服务。
package com.mogujie.marketing.hystrixTest.service;
import org.springframework.stereotype.Service;
@Service("remoteService")
public class RemoteService {
public Object getUser() {
Thread.sleep(2500);
return "user";
}
}
5.新建UserController,调用远程服务。
package com.mogujie.marketing.hystrixTest.controller;
import com.mogujie.marketing.hystrixTest.service.RemoteService;
import com.netflix.hystrix.contrib.javanica.annotation.HystrixCommand;
import com.netflix.hystrix.contrib.javanica.annotation.HystrixProperty;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;
@RestController
@RequestMapping({"/test"})
public class UserController {
@Autowired
private RemoteService remoteService;
@RequestMapping(value = "/user")
@HystrixCommand(fallbackMethod = "fallback", threadPoolProperties = {
@HystrixProperty(name = "coreSize", value = "30"), @HystrixProperty(name = "maxQueueSize", value = "100"),
@HystrixProperty(name = "queueSizeRejectionThreshold", value = "20")}, commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "3000"),
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold", value = "1")
})
public Object getUser() throws InterruptedException {
Object user = remoteService.getUser();
return user;
}
public Object fallback(Throwable e) {
e.printStackTrace();
return "test";
}
}
6.浏览器调用http://127.0.0.1/test/user
可以看到正常返回的结果。调整Thread.sleep的时间为3000,可以看到fallback函数返回的结果。
从上面的例子可以快速体会到Hystrix给远程服务调用带来的好处,只需要简单的配置一个注解,就能给远程服务加上超时时间&错误回调。
Hystrix可以支持RPC、DB、HTTP等远程服务的超时&错误回调,甚至可以做本地服务的超时&错误回调。刚刚的例子就是模拟本地服务执行超时的情况。
一般来说,RPC框架都有基本的超时机制,但是错误处理和功能降级往往要自己来实现,Hystrix帮我省略了这部分冗余的代码,只需要写一个回调函数,简单配置一下就完工了。
3.Hystrix的配置项
那Hystrix有哪些配置项?那些配置项又支持哪些功能?这些功能又在什么情况下被用到呢?解决这些问题是Hystrix进阶的关键。
3.1 Hystrix有哪些配置项?
官方配置项地址:配置项详解.
- execution.isolation.strategy:设置方法执行的隔离策略。可选线程池或者信号量。具体分析参考这篇文章Hystrix系列-5-Hystrix的资源隔离策略。
- execution.isolation.thread.timeoutInMilliseconds:设置调用者等待命令执行的超时限制,超过此时间,HystrixCommand被标记为TIMEOUT,并执行回退逻辑。
- execution.timeout.enabled:执行是否有超时限制。
- execution.isolation.thread.interruptOnTimeout:当超时的时候是否中断
- execution.isolation.thread.interruptOnCancel:当发生cancel事件后是否中断
- execution.isolation.semaphore.maxConcurrentRequests:当使用信号量隔离的时候,此配置有效。官方给出5000请求只需要2个。
- fallback.isolation.semaphore.maxConcurrentRequests:最大并发数,超过此并发则拒绝请求。
- fallback.enabled:是否打开降级
- circuitBreaker.enabled:是否打开熔断器。
- circuitBreaker.requestVolumeThreshold:时间窗口内最小请求数,当小于这个请求数,即使全部失败也不会熔断。
- circuitBreaker.sleepWindowInMilliseconds:熔断后,请求retry的时间间隔
- circuitBreaker.errorThresholdPercentage:失败率阈值,超过这个失败率就会熔断
- circuitBreaker.forceOpen:是否强制开启熔断,这样会导致拒绝所有请求
- circuitBreaker.forceClosed:是否强制关闭熔断,这样任何原因都无法触发熔断。注:优先级小于强制开启。
- metrics.rollingStats.timeInMilliseconds:设置统计滚动窗口的长度,以毫秒为单位。用于监控和熔断器。
滚动窗口被分隔成桶(bucket)。并进行滚动。 例如这个属性设置10000ms,一个桶就是1s。 - metrics.rollingStats.numBuckets :统计窗口的桶数量。
- metrics.rollingPercentile.enabled:执行时间是否被跟踪,并且计算各个百分比,50%,90%等的时间。
- metrics.rollingPercentile.timeInMilliseconds:设置执行时间在滚动窗口中保留时间,用来计算百分比。
- metrics.rollingPercentile.numBuckets:设置rollingPercentile窗口的桶数量。
- metrics.rollingPercentile.bucketSize :设置每个桶保存的执行时间的最大值。
- metrics.healthSnapshot.intervalInMilliseconds:采样时间间隔。
- requestCache.enabled:设置是否缓存请求,request-scope内缓存。hystrix支持将一个请求结果缓存起来,下一个具有相同key的请求将直接从缓存中取出结果,减少请求开销。要使用该功能必须管理HystrixRequestContext,如果请求B要用到请求A的结果缓存,A和B必须同处一个context。
- requestLog.enabled:设置HystrixCommand执行和事件是否打印到HystrixRequestLog中 。
- maxRequestsInBatch:请求合并的最大请求数
- timerDelayInMilliseconds:请求合并的时间窗口,也就是出现第一个请求后,在该时间间隔内的请求合并,超过则进入下一个时间窗口
- requestCache.enabled:请求合并是否打开请求缓存
- coreSize:线程池的大小
- maximumSize:线程池的最大大小,只会在设置了allowMaximumSizeToDivergeFromCoreSize的情况下生效,一般情况下和线程池大小相同。
- maxQueueSize:
-1
代表使用SynchronousQueue,其它值代表LinkedBlockingQueue.这两个队列用于ThreadPoolExecutor - queueSizeRejectionThreshold:队列拒绝服务的阈值
- keepAliveTimeMinutes:如果线程池的最大值大于线程池的大小,那么这个配置用于回收多久没被使用的线程。
- allowMaximumSizeToDivergeFromCoreSize:线程池的最大值是否可以和线程池的值不一样
- metrics.rollingStats.timeInMilliseconds:设置统计滚动窗口的长度,以毫秒为单位。用于监控和熔断器。滚动窗口被分隔成桶(bucket)。并进行滚动。 例如这个属性设置10000ms,一个桶就是1s。
- metrics.rollingStats.numBuckets:统计窗口的桶数量
3.2 Hystrix配置解析
- Execution分组下的配置项,指定了方法执行的隔离策略、超时限制等属性。
- Fallback分组下的配置项,指定了最大并发限制,超过并发限制则走降级方法。
- Circuit Breaker分组下的配置项,指定了熔断器的最小请求数、熔断之后的重试间隔、造成熔断的请求失败率。
- Metrics分组下的配置项,主要是统计相关的参数,指定了滚动窗口的时间长度、桶数量、方法执行时间的保留时间等。这块配置会比较难理解。
- Request Context分组下的配置项,指定了是否缓存请求结果、是否记录日志。
- Collapser Properties分组下的配置项,用来支持请求合并功能。当单个请求耗时很大的时候,可以使用请求合并的方式调用批量接口。设置最大请求数,合并请求的等待时间,配置请求结果是否需要缓存。单个请求耗时很低的时候,不建议使用,反而会降低平均请求时延。需要通过评估和计算得出哪种方案更合适。
- Thread Pool Properties分组下的配置项目,指定了方法执行的线程池的初始化参数。
4. 实现原理
Hystrix实现了熔断机制、请求超时、限流降级、结果缓存、请求合并、统计、线程池隔离等功能共同保障应用的稳定性。
先来看看官方的流程图:
分为以下步骤:
1.初始化HystrixCommand
2.执行Command
3.是否需要走缓存获取结果?
4.是否已经开启了熔断?
5.信号量/线程池拒绝请求?
6.实际执行方法
7.上报结果判断是否开启熔断
8.执行失败走降级方法
9.执行成功结果返回
处理执行成功结果时使用了RxJava(观察者模式)来传递事件,流程如下图所示:
参考文献
1.在项目中快速加入Netflix Hystrix特性
2.Hystrix入门指南
3.Hystrix配置简单说明(官方文档简译)
4.微服务(二)hystrix
5.Hystrix系列-5-Hystrix的资源隔离策略
6.通过HystrixCollapser合并请求提高应用吞吐量
7.How it Works