为了避免单点故障,一般会在多台机器上部署多个服务,客户端可以访问任何一台机器,当调用服务失败,客户端也会有多种选择,是抛出异常,还是重试等。
集群容错涉及到上述两个方面:
- 选择合适的服务调用;
- 对服务调用失败做出后续处理。
dubbo的集群容错功能实现是在cluster路由层实现的。Cluster层将多个服务提供者合并为一个Cluster Invoker,并将Cluster Invoker暴露给客户端;客户端调用时,该Invoker从Directory中找到所有可用服务的Invoker列表(Invoker可以认为是远程服务提供者,Directory记录了所有可用的远程服务列表),后根据路由规则、负载均衡选择一个合适的Invoker调用。
合并为一个Cluster Invoker流程图如下:
客户端调用远程服务的流程如下:
集群容错方案在Cluster Invoker中实现的。
Cluster层主要有两个接口:Cluster和Invoker。
Cluster接口的实现类有很多,这些实现类完成了第一个图的蓝色方块功能:
- mock=org.apache.dubbo.rpc.cluster.support.wrapper.MockClusterWrapper
- failover=org.apache.dubbo.rpc.cluster.support.FailoverCluster
- failfast=org.apache.dubbo.rpc.cluster.support.FailfastCluster
- failsafe=org.apache.dubbo.rpc.cluster.support.FailsafeCluster
- failback=org.apache.dubbo.rpc.cluster.support.FailbackCluster
- forking=org.apache.dubbo.rpc.cluster.support.ForkingCluster
- available=org.apache.dubbo.rpc.cluster.support.AvailableCluster
- mergeable=org.apache.dubbo.rpc.cluster.support.MergeableCluster
- broadcast=org.apache.dubbo.rpc.cluster.support.BroadcastCluster
- zone-aware=org.apache.dubbo.rpc.cluster.support.registry.ZoneAwareCluster
这些实现类都比较简单,例如:
public class FailsafeCluster extends AbstractCluster {
public final static String NAME = "failsafe";
public <T> AbstractClusterInvoker<T> doJoin(Directory<T> directory) throws RpcException {
return new FailsafeClusterInvoker<>(directory);
}
}
作用主要是创建Cluster Invoker对象,也就是Invoker接口的实现。Cluster Invoker对象是最终暴露给客户端的。抽象类AbstractCluster使用ClusterInterceptor拦截器对doJoin方法返回的对象Cluster Invoker封装。