本文使用一个简单示例说明 Hadoop RPC的使用
1. RPC 定义
百度百科:RPC是远程过程调用(Remote Procedure Call)的缩写形式。SAP系统RPC调用的原理其实很简单,有一些类似于三层构架的C/S系统,第三方的客户程序通过接口调用SAP内部的标准或自定义函数,获得函数返回的数据进行处理后显示或打印。
1.1 简单分析下定义
- 远程:不同
- 过程:进程
- 调用:方法的调用
也就是说 远程过程调用
就是不同进程间的方法调用
,定义中还说 RPC 是 C/S 系统,那么就应该是 客户端调用服务端的方法
1.2 RPC 角色
- 客户端 :负责请求服务端
- 服务端 :负责实际代码执行
- 协议:其实就是接口,里面定义了很多方法,服务端必须实现所有的协议
2. Hadoop RPC 示例
- 引入依赖
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>2.7.0</version>
</dependency>
- 定义协议
//协议代码
public interface ProDemo {
long versionID = 12345L;
void run_server();
}
+ 接口必须定义 `long versionID` 字段,否则会报错,提示找不到 `versionID` 字段
- 服务端代码
//服务端
public class ServerDemo implements ProDemo {
public static void main(String[] args) throws IOException {
RPC.Server server = new RPC.Builder(new Configuration())
.setBindAddress("localhost")
.setPort(9999)
.setProtocol(ProDemo.class)
.setInstance(new ServerDemo())
.build();
server.start();
}
public void run_server() {
System.out.println("run_server");
}
}
+ 服务端必须实现 1 中定义的接口
+ 使用 RPC.Builder 构建一个 RPC 服务,并调用它的 start 方法启动 RPC 服务
+ 这里使用了 `构造者模式`,
- 客户端代码
//客户端
public class ClientDemo {
public static void main(String[] args) throws IOException {
ProDemo proDemo = RPC.getProxy(ProDemo.class,
ProDemo.versionID,
new InetSocketAddress("localhost", 9999),
new Configuration());
proDemo.run_server();
}
}
+ 客户端使用 RPC.getProxy 方法获得 RPC 协议的代理,并使用代理调用 服务端的方法
Hadoop RPC 总结:
- 协议
- 接口必须有 versionID 字段(名字必须是 versionID)
- 服务端
- 使用 RPC.Builder 构建服务端,
- 以后看到 RPC.Builder 的代码就可以认为该类是个 RPC 服务
- 实现协议,绑定IP和端口,并启动
- 客户端:
- 使用 RPC.getProxy 获得协议的代理,使用该代理调用服务端的方法
- 以后看到 RPC.getProxy 的代码,就可以认为该类是个 RPC 客户端,必然调用了服务端的代码
- JPS 看到的进程都是 RPC 的服务端
- 如 Namenode 、Datanode、JournalNode 等等都是 RPC 服务端