Eureka实现功能:
- 注册中心(应用程序之间解耦,包括Provider和Consumer之间的解耦,也包括集群模式下的Provider和Provider之间的解耦,不需要知道彼此的地址,通过eureka地址和serviceId来识别)
- 灵活的扩展性(基于注册中心的功能,可以灵活的新增或者减少集群中的数量,只需要添加和减少serviceId相同的节点即可)
- 发现功能,心跳功能,定时尝试连接节点,应用程序恢复后重新接入的功能
基本原理
Eureka的高可用性:
- Eureka在设计时就优先保证可用性。Eureka各个节点都是平等和独立的,任意节点挂掉不会影响其它正常节点的工作,剩余的正常节点依然可以提供注册和查询服务。
- Eureka的客户端在向某个Eureka注册或时如果发现连接失败,则会自动切换至其它节点,只要有一台Eureka还在,就能保证注册服务可用(保证可用性),只不过查到的信息可能不是最新的(不保证强一致性)。因此, Eureka可以很好的应对因网络故障导致部分节点失去联系的情况,而不会像zookeeper那样使整个注册服务瘫痪
EurekaServer集群模式下的工作原理:
- Client只需要向其中的某一个Server节点注册,处于不同节点的eurekaServer通过Replicate进行数据同步
- 当Client-Consumer要调用Client-Provider的时候,则向服务注册中心中的某一个EurekaServer获取服务提供者地址,然后会将服务提供者地址缓存在本地,下次再调用时,则直接从本地缓存中取,完成一次调用。
- Eureka Server启动时会开启定时任务,定时检测所有注册的应用,当检测到服务提供者因为宕机、网络原因不可用时,则在服务注册中心将服务置为DOWN状态,并把当前服务提供者状态向订阅者发布,订阅过的服务消费者更新本地缓存。
- 服务提供者在启动后,周期性(默认30秒)向Eureka Server发送心跳,以证明当前服务是可用状态。Eureka Server在一定的时间(默认90秒,实际是180秒+)未收到客户端的心跳,则认为服务宕机,注销该实例。
Eureka过期策略原理
https://blog.csdn.net/akaks0/article/details/79512680
概括:
Eureka为了避免因为网络抖动(Client-Provider和EurekaServer之间的抖动,但是Client-Provider和Client-Comsumer之间还可以正常通讯)而剔除了原本还可以工作的微服务,所以默认不支持剔除故障服务的功能,需要通过配置开启过期注销功能(eureka.server.enable-self-preservation=false)。EurekaServer在启动时会开启一个定时任务(时间周期默认是60s,也支持自定义配置),会扫描所有心跳响应超时的注册服务(需要在注册服务里面配置超时时间,Eureka存在bug,实际判断超时的时间会Double配置的时间,默认是90s,Double以后就是180s),如果有超时的应用,那么会根据注销因子,逐渐的注销掉应用超时的微服务。Eureka的自我保护机制:不剔除,但是会报错
Eureka Server在运行期间,会统计心跳失败的比例在15分钟之内是否低于85%,如果出现低于的情况(在单机调试的时候很容易满足,实际在生产环境上通常是由于网络不稳定导致),Eureka Server会将当前的实例注册信息保护起来,同时提示这个警告。保护模式主要用于一组客户端和Eureka Server之间存在网络分区场景下的保护。一旦进入保护模式,Eureka Server将会尝试保护其服务注册表中的信息,不再删除服务注册表中的数据(也就是不会注销任何微服务)。详细过程
核心代码AbstractInstanceRegistry.class Line 584
- EurekaServer在启动的时候,会开启一个定时任务,默认是60秒,执行一次过期服务的清理剔除
- 如果enableSelfPreservation是开启的话(默认就是开启的,为了避免网络抖动而剔除掉了还可以提供服务的微服务),则不会尝试剔除超时的节点,所以要手动配置为false
- 支持通过配置evictionIntervalTimerInMs=4000参数来配置,来控制EurekaServer定时任务执行的时间间隔
- 每次遍历所有的注册应用,判断其是否超时过期,然后统计出来
- 判断过期的条件:lease.isExpired(additionalLeaseMs) && lease.getHolder() != null
- isExpired方法,会先获取注册服务配置的leaseExpirationDurationInSeconds时间,也就是duration的值。但是每次在更新lastUpdateTimestamp的时候,都会把系统时间自增duration值,这是Eureka的Bug,注释里面也做了说明。另外如果注册的服务未配置过期时间,Lease的默认超时时间是DEFAULT_DURATION_IN_SECS = 90;累计上这个bug,也就是3min后才会注销掉这个服务。
public static final int DEFAULT_DURATION_IN_SECS = 90;
public boolean isExpired(long additionalLeaseMs) {
return (evictionTimestamp > 0 || System.currentTimeMillis() > (lastUpdateTimestamp + duration + additionalLeaseMs));
}
public void renew() {
lastUpdateTimestamp = System.currentTimeMillis() + duration;}
- 这里面Eureka避免了一次性大量下线,设置了一个最大注销个数的因子,默认0.85,也就是一次最多下线 registerSize - (int)registerSize*0.85,比如10个注册应用,那么至少要保留8个应用,允许一次性剔除的最大个数是2个,如果有问题的节点时4个,那么这一次最多可以随机注销2个,第二轮遍历的时候,8个节点库,最多保留6个,然后正好下线2个,实现了一个平滑的故障服务注销
int registrySize = (int) getLocalRegistrySize();
int registrySizeThreshold = (int) (registrySize * serverConfig.getRenewalPercentThreshold());
int evictionLimit = registrySize - registrySizeThreshold;
int toEvict = Math.min(expiredLeases.size(), evictionLimit);
- 这里面的注销是随机注销的
Random random = new Random(System.currentTimeMillis());
for (int i = 0; i < toEvict; i++) {
int next = i + random.nextInt(expiredLeases.size() - i);
Collections.swap(expiredLeases, i, next);
Lease<InstanceInfo> lease = expiredLeases.get(i);
internalCancel(appName, id, false);
}
- 配置
Eureka Server
eureka:
server:
enableSelfPreservation: false
evictionIntervalTimerInMs: 5000
Application Provider
eureka:
client:
serviceUrl:
defaultZone: http://localhost:8000/eureka/
instance:
leaseRenewalIntervalInSeconds: 10
leaseExpirationDurationInSeconds: 11
实现功能的逻辑
- Eureka通过配置一个提供服务的URL地址,其它服务通过这个url地址来注册自己
- 每个注册的应用都有一个spring.application.name,这个是最关心的标识符,做负载均衡的话,applicationName一定要一样才行。做远程调用的话,也是通过这个applicationName来调用对应程序的服务
- eureka配置
spring.application.name=spring-cloud-eureka
server.port=8000
// 让eureka不检测自己
eureka.client.register-with-eureka=false
eureka.client.fetch-registry=false
eureka.client.serviceUrl.defaultZone=http://localhost:${server.port}/eureka/
- 注册用户的配置
eureka.client.serviceUrl.defaultZone= http://localhost:8761/eureka/
spring.application.name= spring-cloud-psm-main
eureka 集群的配置
因为Eureka作为非常核心的功能,做小的集群是非常必要的。但是要注意的是,其实客户端一旦连通之后,会在自己的内存中备份一份远程通讯的地址,也就是连通成功后,Eureka挂了并不影响业务。
- eureka服务器配置,eureka.client.serviceUrl.defaultZone 相互指向即可。
server:
port: 8011
eureka:
client:
serviceUrl:
defaultZone: http://localhost:8010/eureka/
register-with-eureka: false
fetch-registry: false
instance:
hostname=peer1
server.port=8010
eureka.instance.hostname=peer2
eureka.client.serviceUrl.defaultZone= http://localhost:8011/eureka/
eureka.client.register-with-eureka= false
eureka.client.fetch-registry= false
- eureka客户端配置,逗号分隔开即可
eureka:
client:
serviceUrl:
defaultZone: http://localhost:8010/eureka/,http://localhost:8011/eureka/
eureka常用配置汇总
服务端:设置清理无效节点的时间间隔(单位:毫秒)
eureka.server.eviction-interval-timer-in-ms
客户端:
eureka.instance.lease-renewal-interval-in-seconds
// 让eureka不检测自己
eureka.client.register-with-eureka=false
eureka.client.fetch-registry=false
eureka.client.serviceUrl.defaultZone=http://localhost:${server.port}/eureka/
普通SB项目通过eureka注册来实现 admin监控的配置流程
最关键的:eureka.client.serviceUrl.defaultZone,设置与Eureka Server交互的地址,查询服务和注册服务都需要依赖这个地址。客户端和服务端都设置这个才能相互发现。
- 监管admin的配置
eureka:
instance:
leaseRenewalIntervalInSeconds: 10
client:
registryFetchIntervalSeconds: 5
serviceUrl:
defaultZone: ${EUREKA_SERVICE_URL:http://localhost:8761}/eureka/
- 用户的配置
eureka:
client:
serviceUrl:
defaultZone: http://localhost:8761/eureka/
参考出处
http://www.ityouknow.com/springcloud/2017/05/10/springcloud-eureka.html