[菜鸟SpringCloud实战入门]第五章:熔断器Hystrix的使用 + 可视化监控Hystrix Dashboard和Turbine

欢迎来到菜鸟SpringCloud实战入门系列(SpringCloudForNoob),该系列通过层层递进的实战视角,来一步步学习和理解SpringCloud。

本系列适合有一定Java以及SpringBoot基础的同学阅读。

每篇文章末尾都附有本文对应的Github源代码,方便同学调试。

实战版本

  • SpringBoot:2.0.3.RELEASE
  • SpringCloud:Finchley.RELEASE

熔断器Hystrix的使用

熔断器的概念

关于熔断器的解释,这里引用一大段:

熔断器适用于实现快速失败,如果它在一段时间内侦测到许多类似的错误,会强迫其以后的多个调用快速失败,不再访问远程服务器,从而防止应用程序不断地尝试执行可能会失败的操作,使得应用程序继续执行而不用等待修正错误,或者浪费CPU时间去等到长时间的超时产生。熔断器也可以使应用程序能够诊断错误是否已经修正,如果已经修正,应用程序会再次尝试调用操作。

熔断器模式就像是那些容易导致错误的操作的一种代理。这种代理能够记录最近调用发生错误的次数,然后决定使用允许操作继续,或者立即返回错误。 熔断器开关相互转换的逻辑如下图:

在这里插入图片描述

熔断器就是保护服务高可用的最后一道防线。

Hystrix特性

1.断路器机制

断路器很好理解, 当Hystrix Command请求后端服务失败数量超过一定比例(默认50%), 断路器会切换到开路状态(Open). 这时所有请求会直接失败而不会发送到后端服务. 断路器保持在开路状态一段时间后(默认5秒), 自动切换到半开路状态(HALF-OPEN). 这时会判断下一次请求的返回情况, 如果请求成功, 断路器切回闭路状态(CLOSED), 否则重新切换到开路状态(OPEN). Hystrix的断路器就像我们家庭电路中的保险丝, 一旦后端服务不可用, 断路器会直接切断请求链, 避免发送大量无效请求影响系统吞吐量, 并且断路器有自我检测并恢复的能力.

2.Fallback

Fallback相当于是降级操作. 对于查询操作, 我们可以实现一个fallback方法, 当请求后端服务出现异常的时候, 可以使用fallback方法返回的值. fallback方法的返回值一般是设置的默认值或者来自缓存.

3.资源隔离

在Hystrix中, 主要通过线程池来实现资源隔离. 通常在使用的时候我们会根据调用的远程服务划分出多个线程池. 例如调用产品服务的Command放入A线程池, 调用账户服务的Command放入B线程池. 这样做的主要优点是运行环境被隔离开了. 这样就算调用服务的代码存在bug或者由于其他原因导致自己所在线程池被耗尽时, 不会对系统的其他服务造成影响. 但是带来的代价就是维护多个线程池会对系统带来额外的性能开销. 如果是对性能有严格要求而且确信自己调用服务的客户端代码不会出问题的话, 可以使用Hystrix的信号模式(Semaphores)来隔离资源.

使用Feign Hystrix

依然使用上一章建立的子模块:Service-Feign

pom文件不需要变化,因为spring-cloud-starter-openfeign已经自带了Hystrix。

修改配置文件application.yml,增加如下:

feign:
  hystrix:
    enabled: true

在我这里,由于Springboot使用了2.0.3,引入的是openfeign,所以出现了:

在这里插入图片描述

起初以为这条指令无法生效,折腾了之后才发现是生效的。

推测是openfeign的问题,不是spring boot 1.X的spring-cloud-starter-feign,IDEA判断失误了。

接着新建类ServiceHiHystrix继承ServiceHi接口,里面实现了失败下的返回信息:

import org.springframework.stereotype.Component;

@Component
public class ServiceHiHystrix implements ServiceHi {
    @Override
    public String sayHiFromServiceHi(String name) {
        return "hello" + name +", this message send failed";
    }
}

更改ServiceHi接口,添加上fallback类为刚才新建的类:

@FeignClient(value = "service-hi", fallback = ServiceHiHystrix.class)

大功告成,启动server-feign,eureka-hi和eureka测试:

在这里插入图片描述

打开:http://localhost:8765/hello/rude3knife

在这里插入图片描述

接着,关掉服务提供者eureka-hi,来模拟服务宕机的情况,重新访问:http://localhost:8765/hello/rude3knife

在这里插入图片描述

返回了新建的错误信息。

可视化熔断器监控Hystrix Dashboard和Turbine

Hystrix Dashboard

Hystrix-dashboard是一款针对Hystrix进行实时监控的工具,通过Hystrix Dashboard我们可以在直观地看到各Hystrix Command的请求响应时间, 请求成功率等数据。

我们只需要在上一章中的server-feign模块继续修改,因为上一章已经在该模块加了熔断器。

首先添加依赖:

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <!--spring boot 1.X:spring-cloud-starter-hystrix-->
    <artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <!--spring boot 1.X:spring-cloud-starter-hystrix-dashboard-->
    <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>

启动类修改:

@EnableHystrixDashboard
@EnableCircuitBreaker

启动工程访问:

http://localhost:8765/hystrix,将会看到如下界面:

在这里插入图片描述

图中会有一些提示:

大概意思就是如果查看默认集群使用第一个url,查看指定集群使用第二个url,单个应用的监控使用最后一个,我们暂时只演示单个应用的所以在输入框中输入: http://localhost:8765/hystrix.stream ,输入之后点击 monitor,进入页面。

如果没有请求会先显示Loading ...,访问http://localhost:9001/hystrix.stream 也会不断的显示ping。

请求服务http://localhost:8765/hello/rude3knife,就可以看到监控的效果了,首先访问http://localhost:8765/hystrix.stream,显示如下:

在这里插入图片描述

出错了!

随机谷歌了下问题,网友给出了问题解决方案:

https://blog.csdn.net/ddxd0406/article/details/79643059

答主通过查看源码后给出的解决方案是:

在这里插入图片描述

评论区给出更为方便且优雅的方案:

在配置文件中加入management.endpoints.web.exposure.include=*,将端口暴露就不需要声明bean了,访问地址要变一下/actuator/hystrix.stream

于是我们在yml中加入:

# 熔断器DashBoard: actuator在boot2.0调整后开关web端点的配置,*代表开启所有
management:
  endpoints:
    web:
      exposure:
        include: "*"

重新运行模块,然后在网址一栏输入:

http://localhost:8765/actuator/hystrix.stream

页面会不停显示Loading,不用慌,不显示Unable to connect to Command Metric Stream.了。显示Loading是因为因为还没有请求过来。

之后我们尝试发一次请求,在地址栏对server-feign的8765端口发送请求:

http://localhost:8765/hello/1232312

再来看之前的页面,大功告成。

在这里插入图片描述

到此单个应用的熔断监控已经完成。

Turbine

但是只使用Hystrix Dashboard的话, 你只能看到单个应用内的服务信息, 这明显不够. 我们需要一个工具能让我们汇总系统内多个服务的数据并显示到Hystrix Dashboard上, 这个工具就是Turbine.

在复杂的分布式系统中,相同服务的节点经常需要部署上百甚至上千个,很多时候,运维人员希望能够把相同服务的节点状态以一个整体集群的形式展现出来,这样可以更好的把握整个系统的状态。

在这里插入图片描述

注意:

为了演示Turbine,在这里重新新建一个子模块,名为hystrix-dashboard-turbine,创建步骤请看之前的第一章。

创建新模块作为单独的监控节点模块,是因为演示dashboard的时候是耦合在了server-feign中,而Turbine需要同时监控多个服务消费者,把他耦合在一个消费者里显得不合时宜。

创建后,pom.xml中引入:

<dependency>
    <groupId>org.springframework.cloud</groupId>
    <!--spring boot 1.X:spring-cloud-starter-hystrix-dashboard-->
    <artifactId>spring-cloud-starter-netflix-hystrix-dashboard</artifactId>
</dependency>
<dependency>
    <groupId>org.springframework.cloud</groupId>
    <artifactId>spring-cloud-netflix-turbine</artifactId>
</dependency>

启动类中@EnableTurbine和@EnableHystrixDashboard:

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.netflix.hystrix.dashboard.EnableHystrixDashboard;
import org.springframework.cloud.netflix.turbine.EnableTurbine;

@SpringBootApplication
@EnableTurbine
@EnableHystrixDashboard
public class HystrixDashboardTurbineApplication {

    public static void main(String[] args) {
        SpringApplication.run(HystrixDashboardTurbineApplication.class, args);
    }

}

yml中:

server:
  # 服务端口号
  port: 8767
spring:
  application:
    # 服务名,即serviceId
    name: hystrix-dashboard-turbine
eureka:
  client:
    serviceUrl:
      # 安全认证的服务注册中心地址
      defaultZone: http://localhost:8761/eureka
# 熔断器turbine
turbine:
  aggregator:
    cluster-config: default
  cluster-name-expression: new String("default")
  app-config: SERVICE-FEIGN, SERVICE-FEIGN-2

代码重点:

  • 新模块端口号为:8767
  • turbine.appConfig :配置Eureka中的serviceId列表,表明监控哪些服务(这里指定为SERVICE-FEIGN, SERVICE-FEIGN-2,稍后说)
  • turbine.aggregator.clusterConfig :指定聚合哪些集群,多个使用”,”分割,默认为default。可使用http://.../turbine.stream?cluster={clusterConfig之一}访问
  • turbine.clusterNameExpression :
    • clusterNameExpression指定集群名称,默认表达式appName;此时:turbine.aggregator.clusterConfig需要配置想要监控的应用名称;
    • 当clusterNameExpression: default时,turbine.aggregator.clusterConfig可以不写,因为默认就是default;
    • 当clusterNameExpression: metadata[‘cluster’]时,假设想要监控的应用配置了eureka.instance.metadata-map.cluster: ABC,则需要配置,同时turbine.aggregator.clusterConfig: ABC

完成这些步骤后,我们还需要调整下服务提供者,我们需要两个服务提供者同时运行。

将8765(SERVICE-FEIGN)的服务提供者改为8766,名称改为:SERVICE-FEIGN-2,运行起来,别忘了在运行设置中设置允许多个实例运行。修改后的SERVICE-FEIGN的yml是:

server:
  # 服务端口号
  port: 8766
spring:
  application:
    # 服务名,即serviceId
    name: service-feign-2
eureka:
  client:
    serviceUrl:
      # 安全认证的服务注册中心地址
      defaultZone: http://localhost:8761/eureka
# 熔断器设置
feign:
  hystrix:
    enabled: true
# 熔断器DashBoard: actuator在boot2.0调整后开关web端点的配置,*代表开启所有
management:
  endpoints:
    web:
      exposure:
        include: "*"

运行后结构如图:

在这里插入图片描述

我们访问:

访问 http://localhost:8767/turbine.stream

可以看到ping的信息流,这时说明8767正在不断ping指定的两个服务

在这里插入图片描述

进行图形化监控查看,输入:http://localhost:8767/hystrix ,返回酷酷的小熊界面,输入: http://localhost:8767/turbine.stream ,然后点击 Monitor Stream ,可以看到出现了监控列表:

在这里插入图片描述

咦?为啥只有一个监控呢,说好的聚合监控列表呢。

这里有个坑,或者说是理解上的误区:

监控不同的服务熔断,首先得是不同的rpc调用,也就是消费者的熔断函数要是两个不同的,或者,消费者去调用的是两个不同的服务提供者!这样才会有多个监控表。不然,有何意义?

想明白这一步,你就应该知道怎么把多个表弄出来了。

你需要让消费者有一个:

  • 新的消费目标(新的服务提供者)
  • 或者是一个新的消费熔断器。

修改server-feign子模块

  1. ServiceHi接口的调用变为sayHiFromServiceHi2,value也指向另一个服务提供者service-hi-2 (新的消费目标(新的服务提供者))
@FeignClient(value = "service-hi-2", fallback = ServiceHiHystrix.class)
public interface ServiceHi {
    /**
     * <p>通过Feign伪Http客户端调用service-hi提供的服务</p>
     * @author hanchao 2018/5/19 17:59
     **/
    @GetMapping("/hi/{name}")
    String sayHiFromServiceHi2(@PathVariable(value = "name") String name);
}

  1. 修改熔断器ServiceHiHystrix (新的消费熔断器)
@Component
public class ServiceHiHystrix implements ServiceHi {
    @Override
    public String sayHiFromServiceHi2(String name) {
        return "hello" + name +", this message send failed. By Hystrix.";
    }
}
  1. 当然,随之更改的是HelloController,需要改为return serviceHi.sayHiFromServiceHi2
@RestController
public class HelloController {

    /** 注入服务"service-hi"的Feign客户端ServiceHi */
    @Autowired
    private ServiceHi serviceHi;

    /**
     * 调用Feign客户端提供的服务,自带负载均衡
     * @param name
     * @return
     */
    @GetMapping("/hello/{name}")
    public String sayHi(@PathVariable String name){
        //调用Feign客户端ScheduleServiceHi的接口
        return serviceHi.sayHiFromServiceHi2(name);
    }
}

这样改完后,重启这个8766的服务消费者

结构依然不变:

在这里插入图片描述

我们得到了:

在这里插入图片描述
  • 上方两排:不同的熔断器
  • 下方两排:不同的消费提供者

这里确实比较难理解哈,坑了我好久。

参考

springcloud(四):熔断器Hystrix

http://www.ityouknow.com/springcloud/2017/05/16/springcloud-hystrix.html

springcloud(五):熔断监控Hystrix Dashboard和Turbine

http://www.ityouknow.com/springcloud/2017/05/18/hystrix-dashboard-turbine.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,064评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,606评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,011评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,550评论 1 269
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,465评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,919评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,428评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,075评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,208评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,185评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,191评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,914评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,482评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,585评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,825评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,194评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,703评论 2 339

推荐阅读更多精彩内容