本文翻译自http://www.hivemq.com/blog/mqtt-essentials-part-10-alive-client-take-over
未经允许,不得转载
TCP半开连接(half-open)的问题
正如我们所知,MQTT是基于TCP的,并且它可以保证数据包在网络传输时的“可靠,有序,错误可查”这些特性。然而,在某些情况下一个传输端点可能会无法和其他传输端点同步,这常常是因为一方出现问题,或者传输过程中出现问题。这种情况被叫做半开(half-open)连接。重点是仍在正常工作的一方并不知道对方出现了什么问题,它会不断尝试发送信息并等待对方回应。
在移动网络下,半开连接的问题愈发突出,正如下文中MQTT发明者Andy Stanford-Clark所描述的一样
尽管从理论上来说,TCP/IP会在socket失效时发出通知,但是实际上,尤其是移动网络或者卫星网络上,经常会出现假连并且首尾颠倒的问题,这可能会导致一个TCP会话出现“黑洞”,看似连接仍然打开着,但是实际上写入的任何消息都被丢弃了。
引自Andy Stanford-Clark的“为何需要心跳?”一文(来源)
MQTT心跳
为了应对半开连接问题,或至少可以知道连接是否还在,MQTT提供了心跳(keep alive)机制。
心跳机制可以确认连接仍然是打开的,并且broker和客户端都连接上了对方。因此客户端可以设定一个几秒钟的时间间隔,并在连建立后按此间隔来发送消息给broker。心跳的间隔时间是broker和客户端所能接受的最长的通信周期。
MQTT的说明书描述如下
客户端有职责来确保发送的数据包间隔不超过心跳周期。如果没有数据包待发,那么客户端必须发送一个PINGREQ包。
这意味着只要消息被频繁地交换,而且心跳时长也没有超出阈值,那么就没有必要再发送额外的消息来确认连接是否开着了
但是如果客户端在心跳周期内没有任何消息可以发送,那么它必须发送一个PINGREQ包给broker来确认它本身和broker仍然可用。
如果客户端没有在1.5倍心跳周期内发送PINGREQ或者其他数据,那么broker必须与客户端断开连接。同样的,如果broker没有在规定的时间内响应,客户端也应该主动断开连接。
心跳包
让我们看看心跳信息的详细内容。这里有两个信息与心跳功能相关。
PINGREQ
PINGREQ由客户端发出,用以向broker表明客户端仍然OK,即便它没发送任何其他数据包(如发布和订阅信息等)。客户端可以在任何时间发送PINGREQ来确认网络连接是有效的。PINGREQ包不含任何包体(payload)。
PINGRESP
当broker收到一个PINGREQ消息时,其必须回复一个PINGRESP以表明自身对客户端来说是可用的。和PINGREQ相似,PINGRESP也不含任何包体(payload)。
提示
- 如果broker没有在规定时间内收到PINGREQ或其他任何消息,那么它就会关闭与此客户端的连接并且发送遗嘱消息(前提是客户端已经指定了)。
- MQTT客户端有责任设置好心跳周期值,例如,可以按照信号强度的周期来设定。
- 最长的心跳周期是18小时12分15秒。
- 如果心跳周期为0,那么心跳机制就是无效的。
客户端替换(Take-Over)
一个掉线的客户端一般将会尝试重连。但有一种可能是broker仍和某些客户端维持着半开连接状态。在这种情况下,MQTT将会执行客户替换机制。对于同一个客户端(由客户端标识判定),broker将总会关闭旧连接,并建立新连接。这种方式可以确保半开连接不会阻碍客户端尝试建立新的连接。