一、协议概述
物联网(Internet of Things,IoT)最近曝光率越来越高。虽然HTTP是网页的事实标准,不过机器之间(Machine-to-Machine,M2M)的大规模沟通需要不同的模式:之前的请求/回答(Request/Response)模式不再合适,取而代之的是发布/订阅(Publish/Subscribe)模式。这就是轻量级、可扩展的MQTT(Message Queuing Telemetry Transport)可以施展拳脚的舞台。
MQTT是基于二进制消息的发布/订阅编程模式的消息协议,最早由IBM提出的,如今已经成为OASIS规范。由于规范很简单,非常适合需要低功耗和网络带宽有限的IoT场景,比如:遥感数据、汽车、智能家居、智慧城市、医疗医护。
由于物联网的环境是非常特别的,所以MQTT遵循以下设计原则:
--精简,不添加可有可无的功能。
--发布/订阅(Pub/Sub)模式,方便消息在传感器之间传递。
--允许用户动态创建主题,零运维成本。
--把传输量降到最低以提高传输效率。
--把低带宽、高延迟、不稳定的网络等因素考虑在内。
--支持连续的会话控制。
--理解客户端计算能力可能很低。
--提供服务质量管理。
--假设数据不可知,不强求传输数据的类型与格式,保持灵活性。
运用MQTT协议,设备可以很方便地连接到物联网云服务,管理设备并处理数据,最后应用到各种业务场景,如下图所示:
二、协议详解
整个协议的构造,从整体上协议可拆分为: 固定头部+可变头部+消息体
1、固定头部(fixed header):
构造如下:
1)Message Type(0和15保留,共占4个字节)
2)DUP flag:其是用来在保证消息传输可靠的,如果设置为1,则在下面的变长头部里多加MessageId,并需要回复确认,保证消息传输完成,但不能用于检测消息重复发送。
3)QoS level:主要用于PUBLISH(发布态)消息的,保证消息传递的次数。
00表示最多一次 即<=1
01表示至少一次 即>=1
10表示一次,即==1
11保留后用
4)RETAIN:主要用于PUBLISH(发布态)的消息,表示服务器要保留这次推送的信息,如果有新的订阅者出现,就把这消息推送给它。如果不设那么推送至当前订阅的就释放了。
5)固定头部的byte 2:是用来保存接下去的变长头部+消息体的总大小的。但并不是直接保存的,同样也是可以扩展的,其机制是,前7位用于保存长度,后一位用做标识。
举个例子:即如果计算出后面的大小为 0<length<=127,正常保存;如果是127<length<16383,则需要二个字节保存了,将第一个字节的最大的一位置1,表示未完。然后第二个字节继续存。拿130来说,第一个字节存10000011,第二个字节存000000001,也就是0x83,0x01,把两个字节连起来看,第二个字节权重从2的8次开始。同起可以加第3个字节,最多可以加至第4个字节。故MQTT协议最多可以实现268 435 455 (0xFF, 0xFF, 0xFF, 0x7F)将近256M的数据。可谓能伸能缩。
例如,数字64十进制被编码为单个字节,十进制值64,十六进制0x40。数字321十进制(= 65 + 2 * 128)被编码为两个字节,最不重要。第一个字节65 + 128 = 193。请注意,顶部位被设置为至少指示一个后续字节。第二个字节是2。
2、可变头部(variable header):
整体结构为:
1)首先最上面的8个字节是Protocol Name(协议名称),UTF编码的字符“MQIsdp”,头两个是编码名提长为6。这里多说 一些,接下去的协议多采用这种方式组合,即头两个字节表示下一部分的长,然后后面跟上内容。这里头两个字节长 为6,下面跟6个字符“MQIsdp”。
2)Protocol Version,协议版本号,v3 也是固定的。
3)Connect Flag,连接标识,有点像固定头部的。8位分别代表不同的标志。第1个字节保留。
Clean Session,Will flag,Will Qos, Will Retain都是相对于CONNECT消息来说的。
Clean Session:0表示如果订阅的客户机断线了,那么要保存其要推送的消息,如果其重新连接时,则将这些消息推 送。1表示消除,表示客户机是第一次连接,消息所以以前的连接信息。
Will Flag,表示如果客户机在不是在发送DISCONNECT消息中断,比如IO错误等,将些置为1,要求重传。并且下面的 Will Qos和Will Retain也要设置,消息体中的Topic和MessageID也要设置,就是表示发生了错误,要重传。
Will Qos,在CONNECT非正常情况下设置,一般如果标识了Will Flag,那么这个位置也要标识。
Will RETAIN:同样在CONNECT中,如果标识了Will Flag,那么些位也一定要标识。
usename flag和password flag,用来标识是否在消息体中传递用户和密码,只有标识了,消息体中的用户名和密码才 用效,只标记密码而不标记用户名是不合法的。
4)Keep Alive,表示响应时间,如果这个时间内,连接或发送操作未完成,则断开tcp连接,表示离线。
5)Connect Return Code即通常于CONNACK消息中,表示返回的连接情况,我可以通过此检验连接情况。
6)Topic name(主题名称):订阅消息标识,MQTT是基于订阅/发布的消息,那么这个就是消息订阅的标识,像新闻客户端里的订阅不同的栏目一样。用于区别消息的推送类别。
主要用于PUBLISH和SUBSCRIBE中。最大可支持32767个字符,即4个字节。
3、消息体(PayLoad)
只有3种消息有消息体CONNECT,SUBSCRIBE,SUBACK。
CONNECT主要是客户机的ClientID,订阅的Topic和Message以及用户名和密码,其于变长头部中的will是对应的。
SUBSCRIBE是包含了一系列的要订阅的主题以及QOS。
SUBACK是用服务器对于SUBSCRIBE所申请的主题及QOS进行确认和回复。
而PUBLISH是消息体中则保存推送的消息,以二进制形式,当然这里的编辑可自定义。
4、Message Identifier:消息标识符存在于以下MQTT消息的变量头中:PUBLISH,PUBACK,PUBREC,PUBREL,PUBCOMP,SUBSCRIBE,SUBACK,UNSUBSCRIBE,UNSUBACK。
消息标识符(Message ID)字段仅存在于固定报头中的QoS位表示QoS级别1或2的消息中。其为16位字符表示,用于在Qos为1或2时标识Message的,保证Message传输的可靠性。