转载:微服务注册中心 Eureka 架构深入解读
一、服务组件功能
前面已经说了服务组件各自的功能,这里回顾一下:
1、服务提供者
- 服务启动后向注册中心发起服务注册register
- 在服务集群中,当一个服务提供者修改后,需要进行服务同步sync
- 停止服务提供者,向注册中心发起 cancel 请求,清空当前服务注册信息
- 服务在运行中需要不断的发送心跳,进行服务续约renew
2、服务消费者
- 启动后,从注册中心拉取服务注册信息,获取服务
- 在运行过程中,定时更新服务注册信息,更新服务
- 服务消费者发起远程调用
3、服务注册中心
- 启动后,从其他节点拉取服务注册信息。同步服务信息
- 运行过程中,定时运行 evict 任务,剔除没有按时 renew 的服务(包括非正常停止和网络故障的服务)。失效剔除
- 运行过程中,接收到的 register、renew、cancel 请求,都会同步至其他注册中心节点。
- 自我保护,避免因为网络等其他原因造成服务误杀
二、服务组件功能原理分析
1、服务注册register
-
服务提供者、服务消费者、以及服务注册中心自己,启动后都会向注册中心注册服务(如果配置了注册)。
1、保存服务信息,将服务信息保存到 registry 中;
2、更新队列,将此事件添加到更新队列中,供 Eureka Client 增量同步服务信息使用。
3、清空二级缓存,即 readWriteCacheMap,用于保证数据的一致性。
4、更新阈值,供剔除服务使用。
5、同步服务信息,将此事件同步至其他的 Eureka Server 节点。
2、服务续约机制renew
-
服务注册后,要定时(默认 30S,可自己配置)向注册中心发送续约请求,告诉注册中心“我还活着”。
1、更新服务对象的最近续约时间,即 Lease 对象的 lastUpdateTimestamp;
2、同步服务信息,将此事件同步至其他的 Eureka Server 节点。
- 剔除服务之前会先判断服务是否已经过期,判断服务是否过期的条件之一是续约时间和当前时间的差值是不是大于阈值。
3、服务注销机制cancel
-
服务正常停止之前会向注册中心发送注销请求,告诉注册中心“我要下线了”。
1、删除服务信息,将服务信息从 registry 中删除;
2、更新队列,将此事件添加到更新队列中,供 Eureka Client 增量同步服务信息使用。
3、清空二级缓存,即 readWriteCacheMap,用于保证数据的一致性。
4、更新阈值,供剔除服务使用。
5、同步服务信息,将此事件同步至其他的 Eureka Server 节点。
- 服务正常停止才会发送 Cancel,如果是非正常停止,则不会发送,此服务由 Eureka Server 主动剔除。
4、服务剔除机制evit
-
Eureka Server 提供了服务剔除的机制,用于剔除没有正常下线的服务。
- 服务的剔除包括三个步骤,首先判断是否满足服务剔除的条件,然后找出过期的服务,最后执行剔除。
(1)判断是否满足服务剔除的条件
1、关闭了自我保护
2、如果开启了自我保护,需要进一步判断是 Eureka Server 出了问题,还是 Eureka Client 出了问题,如果是 Eureka Client 出了问题则进行剔除。
- 这里比较核心的条件是自我保护机制,Eureka 自我保护机制是为了防止误杀服务而提供的一个机制。Eureka 的自我保护机制“谦虚”的认为如果大量服务都续约失败,则认为是自己出问题了(如自己断网了),也就不剔除了;反之,则是 Eureka Client 的问题,需要进行剔除。而自我保护阈值是区分 Eureka Client 还是 Eureka Server 出问题的临界值:如果超出阈值就表示大量服务可用,少量服务不可用,则判定是 Eureka Client 出了问题。如果未超出阈值就表示大量服务不可用,则判定是 Eureka Server 出了问题。阈值的计算:
自我保护阈值 = 服务总数 * 每分钟续约数 * 自我保护阈值因子。
每分钟续约数 =(60S/ 客户端续约间隔)
例如:
如果有 100 个服务,续约间隔是 30S,自我保护阈值 0.85。
自我保护阈值 =100 * 60 / 30 * 0.85 = 170。
如果上一分钟的续约数 =180>170,则说明大量服务可用,是服务问题,进入剔除流程;
如果上一分钟的续约数 =150<170,则说明大量服务不可用,是注册中心自己的问题,进入自我保护模式,不进入剔除流程。
(2)找出过期的服务
遍历所有的服务,判断上次续约时间距离当前时间大于阈值就标记为过期。并将这些过期的服务保存到集合中。
(3)剔除服务
在剔除服务之前先计算剔除的数量,然后遍历过期服务,通过洗牌算法确保每次都公平的选择出要剔除的任务,最后进行剔除。剔除服务后1、删除服务信息,从 registry 中删除服务。2、更新队列,将当前剔除事件保存到更新队列中。3、清空二级缓存,保证数据的一致性。
- 具体参考:AbstractInstanceRegistry.evict()
5、服务获取机制
-
Eureka Client 获取服务有两种方式,全量同步和增量同步。获取流程是根据 Eureka Server 的多层数据结构进行的:无论是全量同步还是增量同步,都是先从缓存中获取,如果缓存中没有,则先加载到缓存中,再从缓存中获取。(registry 只保存数据结构,缓存中保存 ready 的服务信息。)
6、服务同步机制
- 服务同步机制是用来同步 Eureka Server 节点之间服务信息的。它包括 Eureka Server 启动时的同步,和运行过程中的同步。
-
(启动同步)Eureka Server 启动后,遍历 eurekaClient.getApplications 获取服务信息,并将服务信息注册到自己的 registry 中。注意这里是两层循环,第一层循环是为了保证已经拉取到服务信息,第二层循环是遍历拉取到的服务信息。
-
(运行过程同步)当 Eureka Server 节点有 register、renew、cancel 请求进来时,会将这个请求封装成 TaskHolder 放到 acceptorQueue 队列中,然后经过一系列的处理,放到 batchWorkQueue 中。TaskExecutor.BatchWorkerRunnable是个线程池,不断的从 batchWorkQueue 队列中 poll 出 TaskHolder,然后向其他 Eureka Server 节点发送同步请求。
三、源码分析
待定