在网络编程中TCP协议相关的肯定会遇到粘包问题,具体原因可查看相关资料,这里仅作简单叙述。着重在workerman中对TCP中消息封包和解包问题的实际处理。
粘包与拆包的概念
在TCP/IP协议中,由于传输层并不了解应用层数据的含义,发送端传输层可能会对应用层数据进行拆分或者合并,在接收端也同样如此。由此而产生的问题就是常常会听说的“粘包与拆包”的问题。“粘包拆包”的问题在“短报文”和“一问一答”的场景下其实并不会出现。短报文是指报文长度远小于MSS的情况,应用层的报文在TCP报文中完全可以放下。另一方面,“一问一答”的通信模式可以保证报文会以单一的TCP包发送出去。在这两个条件下都满足时,我们不需要考虑“粘包拆包”问题。
反之,如果这两个条件不同时满足,就很可能会出现“粘包拆包”问题。
粘包拆包的问题的原因大概有以下几个方面:
应用程序要写入的报文字节数大于套接字缓存区大小,这时候会发生拆包问题。
应用程序的报文字节数小于套接字缓冲区大小,但应用程序连续写入多个数据包,这会导致粘包问题。
TCP缓冲区的数据比较多,传输层根据MSS对缓冲区的数据进行分片发送。
粘包与拆包的解决
对于粘包和拆包问题,一般有以下几种解决方法:
使用固定长度的消息,报文长度不够的时候用无效数据填充。
使用换行字符来分割不同的报文。
把消息分为消息头和消息体两个部分,在消息头中添加消息长度的字段。
其他综合多种方法的消息协议。
业务实现
解包
由于在我们的业务主要使用tcp长连接来转发消息体,并且长度不固定,因此选择了在消息体中增加长度(4字节)的方式来解决。
//保存每个连接的待处理消息,须在三次握手建立连接后做初始化
$_MACHINE_CONN = []
$tcp_worker->onMessage = function($connection, $data){
global $_MACHINE_CONN;
$conn_id = $connection->id;
//处理粘包问题
while (true){
$curr_data = ((string)$_MACHINE_CONN[$conn_id]['msg_peer']) . $data;
//不够4字节,无法获得此分段消息长度,继续接收数据
if(strlen($curr_data)<4){
$_MACHINE_CONN[$conn_id]['msg_peer'] = $curr_data;
break;
}
//消息长度不够,继续等待接受数据
$curr_msg_length = intval(substr($curr_data, 0, 4));
if($curr_msg_length > (strlen($curr_data)-4)){
$_MACHINE_CONN[$conn_id]['msg_peer'] = $curr_data;
break;
}
//按长度截取有效数据段
$peer_data = (string)substr($curr_data, 4, $curr_msg_length);
$data = (string)substr($curr_data, 4+$curr_msg_length);
$_MACHINE_CONN[$conn_id]['msg_peer'] = '';
//后续业务处理
}
}
封包
对每一段完整的消息增加4字节长度的标识,不满四位高位补'0'
$httpMSG = '{"code":"1","reason":"success"}';
//0031{"code":"1","reason":"success"}
$tcp_msg_length = str_pad(strlen($httpMSG),4,"0",STR_PAD_LEFT);
$tcp_conn->send($tcp_msg_length.$httpMSG);
参考链接:
http://evenvi.com/index.php/archives/48/
http://intheworld.win/2016/12/04/tcp%E7%B2%98%E5%8C%85%E4%B8%8E%E6%8B%86%E5%8C%85-%E5%9F%BA%E4%BA%8Enetty/