一 容错的相关介绍
为什么需要容错
如果在服务之间互相交互时,服务提供者相应非常慢,那么消费者对提供者的请求就会被强制等待,直到提供者响应或超时。在高负载情景下,如果我们不做任何处理,这就会导致服务消费者的资源耗尽甚至整个系统的崩溃。
微服务架构的应用系统一般包含多个服务层,微服务之间通过网络进行通信,因此,服务之间难免存在依赖关系。而任何微服务都并非 100% 可用,网络往往也很脆弱,因此就可能有些请求机会请求失败。一般我们会将因提供者不可用而导致消费者不可用,并将不可用逐渐放大的过程称之为雪崩效应。
如何容错
常见的容错机制需要满足的两点
网络请求超时:
正常情况下一个远程调用一般在几十毫秒内就能得到响应,如过依赖的服务不可用或者网络有问题,那么响应时间就会变得很长,所以设置网络请求超时是很重要的,让资源尽快释放。使用断路器模式
断路器可以理解为对容易出错的操作的代理,这种代理能够统计一段时间内调用失败的次数,并决定是正常请求依赖的服务还是直接返回。
断路器可以实现快速失败:在一段时间检测到许多类似的错误,就会在之后的一段时间内,强迫对该服务的调用快速失败,既不在请求所依赖的服务。
断路器可以自动诊断依赖的服务是否已经恢复正常断路器模式流程
1⃣️正常情况下,断路器关闭,正常请求依赖的服务
2⃣️当一段时间内,请求失败率达到一定的阀值,断路器机会自动打开,此时,不会再去请求依赖的服务
3⃣️断路器打开一段时间后,会自动进入“半开”的状态,此时,断路器允许一个请求去访问依赖的服务。如果该请求调用成功,则关闭断路器;否则继续保持打开状态。
二 Hystrix 简介
Hystrix 是 Netflix 开源的一个延迟和容错库,用于隔离访问远程系统、服务或者第三方库,防止及联失败,从而提升系统的可用性与容错性。Hystrix 主要是通过以下绩点实现延迟和容错
- 包裹请求:可以包裹对依赖的调用逻辑,每个命令会在独立的线程中调用
- 跳闸机制:当某服务的错误率超过一定阀值时,Hystrix 会自动或手动跳闸,停止请求该服务一段时间
- 资源隔离:Hystrix 为每一个依赖都维护来一个小型的线程池。如果该线程池已满,发往该服务的请求就会被立即拒绝,而不是排队等候,从而加速失败判定
监控:Hystrix 可以近乎实时的监控运行指标和配置的变化,例如成功,失败等
回退机制:当请求失败、超时、被拒绝或当断路器打开时,执行回退逻辑,回退逻辑可以自行定义 - 自我修复:断路器打开一段时间后,会自动进入“半开”状态
三 在 Spring Cloud 中整合 Hystrix
在 Spring Cloud 中整合 Hystrix 会非常的方便,只需要加上少量的注解即可。
1 加入 hystrix 的依赖
compile group: 'org.springframework.cloud', name: 'spring-cloud-starter-netflix-hystrix', version:'1.4.0.RELEASE'
2 在启动类上添加 @EnableCircuitBreaker
或者 @EnableCircuitBreaker
注解启动断路器支持
3 修改 Controller
中需要容错的方法
@RestController
public class MovieController {
private static final Logger LOGGER = LoggerFactory.getLogger(MovieController.class);
@Autowired
private RestTemplate restTemplate;
@HystrixCommand(fallbackMethod = "findByIdFallback")
@GetMapping("/user/{id}")
public User findById(@PathVariable Long id) {
return this.restTemplate.getForObject("http://microservice-provider-user/" + id, User.class);
}
public User findByIdFallback(Long id) {
User user = new User();
user.setId(-1L);
user.setName("默认用户");
return user;
}
}
其中:
-
findyByIdFallback
方法是findById
的一个回退方法,该方法与findById
方法具有相同的参数和返回值类型 - 在
findById
方法上使用注解@HystrixCommand
的fallbackMethod
属性指定回退方法。@HystrixCommand
的配置非常灵活,可以使用注解@HystrixProperty
的commandProperties
属性来配置@HystrixCommand
,例如超时时间,最大队列数量(更多配置详情)
🎺当请求超时、被拒绝、超时或者断路器打开时都会进入回退方,但是进入到回退方法并不意味着断路器被打开。只有当达到一定的阀值后,断路器才会被打开。
如果需要更加直观的查看断路器的状态,可以集成
Spring Cloud actuator
,断路器的状态会暴露在Actuator
提供的/health
端点中。
四 Feign 使用 Hystrix
由于 Feign
是以接口的形式工作的,没有方法体,所以前面的方法并不适用。下面会介绍给 UserFeignClient
添加 Hysrix
1 在 UserFeignClient
上添加@FeignClient
注解
@FeignClient(name = "microservice-provider-user", fallback = FeignClientFallback.class)
public interface UserFeignClient {
@RequestMapping(value = "/{id}", method = RequestMethod.GET)
public User findById(@PathVariable("id") Long id);
}
其中:
-
@FeignClient
的fallback
属性对该client
指定了一个对应的回退类
2 编写回退类
@Component
class FeignClientFallback implements UserFeignClient {
@Override
public User findById(Long id) {
User user = new User();
user.setId(-1L);
user.setUsername("默认用户");
return user;
}
}
编写的回退类需要实现UserFeignClient
中的每个方法,那么在消费端在调用服务端的请求时,出现失败则会调用对应的回退方法。
五 禁用 Hystrix
在 Spring Cloud 中,如果添加了 hystrix
的依赖,那么 Feign
就会使用断路器包裹 Feign
客户端的所有方法。
为指定的 Feign
客户端禁用 Hystrix
@Configuration
public class FeignDisableHystrixConfiguration{
@Bean
@Scope("prototype")
public Feign.Builder feignBuilder(){
return Feign.builder();
}
}
@FeignClient(name = "microservice-provider-user", configuration = FeignDisableHystrixConfiguration.class)
public interface UserFeignClient {
@RequestMapping(value = "/{id}", method = RequestMethod.GET)
public User findById(@PathVariable("id") Long id);
}
全局禁用 Hystrix
在 Application.yml
中配置
feign.hystrix.enabled = false
六 使用 Hystrix Dashboard 可视化监控数据
1 创建一个新的项目hystrixDashboard
并添加 dashboard
依赖
compile group: 'org.springframework.cloud', name: 'spring-cloud-starter-netflix-hystrix-dashboard', version:'1.4.0.RELEASE'
2 编写启动类,添加 @EnableHystrixDashboard
@SpringBootApplication
@EnableHystrixDashboard
public class HystrixDashboardApplication {
public static void main(String[] args) {
SpringApplication.run(HystrixDashboardApplication.class, args);
}
}
3 在 Application.yml
中配置
server:
port: 8030
也可以注册在 Eureka 上
4 启动相关services
- microservice-discovery-eureka
- mircroservice-provider-user
- microservice-consumer-movie-feign-hystrix-fallbak-stream(添加了
spring-boot-starter-actuator
依赖,可以通过访问/health
端点来监控数据) - hystrixDashboard
5 访问 http://localhost:8030/hystrix
输入想要可视化的服务端点(例如:http://localhost:8020/hystrix.stream),刷新时间和title,则可以看到该服务的监控详情
此方法只能对单一服务进行监控,如果需要同时监控多个服务,那么可以集成 Turbine 。