UDP是一种没有复杂控制,提供面向无连接通信服务的一种协议。换句话说,它将部分控制转移给应用程序去处理,自己却只提供作为传输层协议的最基本功能。
与UDP不同,TCP则“人如其名”,可以说是对“传输、发送、通信”进行 '“控制”的“协议”。
TCP与UDP的区别柑当大。它充分地实现了数据传输时各种控制功能,可以进行丢包时的重发控制,还可以对次序乱掉的分包进行顺序控制。而这些在UDP 中都没有。此外,TCP作为一种面向有连接的协议,只有在确认通信对端存在时才会发送数据,从而可以控制通信流量的浪费'
根据TCP的这些机制,在IP这种无连接的网络上也能够实现高可靠性的通信。
6. 4. 1 TCP的特点及其目的
为了通过IP数据报实现可靠性传输,需要考虑很多事情,例如数据的破坏、丢包、重复以及分片顺序混乱等问题。如不能解决这些问题,也就无从谈起可靠传输。
TCP通过检验和、序列号、确认应答、重发控制、连接管理以及窗口控制等机制实现可靠性传输。
6. 4.2通过序列号与确认应答提高可靠性
在TCP中,当发送端的数据到达接收主机时,接收端主机会返回一个已收到消息的通知。这个消息叫做确认应答(ACK) ( (Positive Acknowled�gement) 意指已经接收。)。
TCP通过肯定的确认应答(ACK)实现可靠的数据传输。当发送端将数据发出之后会等待对端的确认应答。如果有确认应答,说明数据已经成功到达对端。反之,则数据丢失的可能性很大。
在一定时间内没有等到确认应答,发送端就可以认为数据已经丢失,并进行重发。由此,即使产生了丢包,仍然能够保证数据能够到达对端, 实现可靠传输。
未收到确认应答并不意味着数据一定丢失。也有可能是数据对方已经收到,只是返回的确认应答在途中丢失。这种情况也会导致发送端因没有收到确认应答, 而认为数据没有到达目的地,从而进行重新发送
此外,也有可能因为一些其他原因导致确认应答延迟到达,在源主机重发数据以后才到达的情况也履见不鲜。此时,源发送主机只要按照机制重发数据即可。但是对于目标主机来说,这简直是一种“灾难”。它会反复收到相同的数据。而 为了对上层应用提供可靠的传输,必须得放弃重复的数据包。为此,就必须引入一种机制,它能够识别是否已经接收数据,又能够判断是否需要接收
上述这些确认应答处理、重发控制以及重复控制等功能都可以通过序列号实现。序列号是按顺序给发送数据的每一个字节(8位字节)都标上号码的编号v。接收端査询接收数据TCP首部中的序列号和数据的长度,将自己下一步应该接收的序号作为确认应答返送回去。就这样,通过序列号和确认应答号,TCP可以实现可靠传输。
6.4.3重发超时如何确定
重发超时是指在重发数据之前,等待确认应答到来的那个特定时间间隔。如果超过了这个时间仍未收到确认应答,发送端将进行数据重发。那么这个重发超时的具体时间长度又是如何确定的呢?
最理想的是,找到一个最小时间,它能保证“确认应答一定能在这个时间内 返回”。然而这个时间长短随着数据包途径的网络环境的不同而有所变化。例如 在高速的LAN中时间相对较短,而在长距离的通信当中应该比LAN要长一些3 即使是在同一个网络中,根据不同时段的网络拥堵程度时间的长短也会发生变化。
TCP要求不论处在何种网络环境下都要提供高性能通信,并且无论网络拥堵情况发生何种变化,都必须保持这一特性。为此,它在每次发包时都会计算往返时间T及其偏差' 将这个往返时间和偏差相加重发超时的时间,就是比这个总和要稍大一点的值。
重发超时的计算既要考虑往返时间又要考虑偏差是有其原因。如图6.11所 示,根据网络环境的不同往返时间可能会产生大幅度的摇摆,之所以发生这种情 况是因为数据包的分段是经过不同线路到达的。TCP/IP的目的是即使在这种环境下也要进行控制,尽量不要浪费网络流量。
在BSD的Unix以及Windows系统中,超时都以0. 5秒为单位进行控制,因此 重发超时都是0.5秒的整数倍' 不过,由于最初的数据包还不知道往返时间, 所以其重发超时一般设置为6秒左右。
数据被重发之后若还是收不到确认应答,则进行再次发送。此时,等待确认应答的时间将会以2倍、4倍的指数函数延长。
此外,数据也不会被无限、反复地重发。达到一定重发次数之后,如果仍没有任何确认应答返回,就会判断为网络或对端主机发生了异常,强制关闭连接。并且通知应用通信异常强行终止。
6. 4.4 连接管理
TCP提供面向有连接的通信传输。面向有连接是指在数据通信开始之前先做好通信两端之间的准备工作
UDP是一种面向无连接的通信协议,因此不检査对端是否可以通信,直接将UDP包发送出去。TCP与此相反,它会在数据通信之前,通过TCP首部发送一个SYN包作为建立连接的请求等待确认应答' 如果对端发来确认应答,则认为可 以进行数据通信。如果对端的确认应答未能到达,就不会进行数据通信。此外, 在通信结束时会进行断开连接的处理(FIN包)。
建立一个TCP连接耩要发送3个包。这个过程也称作"三 次握手"。
可以使用TCP首部用于控制的字段来管理TCP连接。一个连接的建立与断开,正常过程至少需要来回发送7个包才能完成。(3次握手四次挥手)
6.4.5 TCP以段为单位发送数据
在建立TCP连接的同时,也可以确定发送数据包的单位,我们也可以称其为“最大消息长度”(MSS: Maximum Segment Size) 0最理想的情况是,最大消息长度正好是IP中不会被分片处理的最大数据长度。
TCP在传送大量数据时,是以MSS的大小将数据进行分割发送。进行重发时也是以MSS为单位。
MSS是在三次握手的时候,在两端主机之间被计算得出。两端的主机在发出建立连接的请求时,会在TCP首部中写入MSS选项,告诉对方自己的接口能够适应的MSS的大小T。然后会在两者之间选择一个较小的值投入使用
(为附加MSS选项,TCP首部将不再是20字节,而是4 字节的整数倍。如图6. 13所 示扣+4 在建立连接时,如果某一方 的MSS选项被省略,可以选为IP包的长度不超过576字节的 值(IP首部20字节,TCP首部20字节,MSS536字节))
6. 4.6利用窗口控制提高速度
TCP以1个段为单位,每发一个段进行一次确认应答的处理,如图6.14。这 样的传输方式有一个缺点。那就是,包的往返时间越长通信性能就越低。
为解决这个问题,TCP引入了窗口这个概念。即使在往返时间较长的情况下, 它也能控制网络性能的下降。图6. 15所示,确认应答不再是以每个分段,而是以 更大的单位进行确认时,转发时间将会被大幅度的缩短。也就是说,发送端主机, 在发送了一个段以后不必要一直等待确认应答,而是继续发送。
确认应答
窗口大小就是指无需等待确认应答而可以继续发送数据的最大值。图6. 15 中,窗口大小为4个段。
这个机制实现了使用大量的缓冲区' 通过对多个段同时进行确认应答的 功能。
如图6. 16所示,发送数据中高亮圈起的部分正是前面所提到的窗口。在这个 窗口内的数据即便没有收到确认应答也可以发送出去。此外,从该窗口中能看到 的数据因其某种数据已在传输中丢失,所以发送端才能收到确认应答,这种情况 也需进行重发。为此,发送端主机在等到确认应答返回之前,必须在缓冲区中保 留这部分数据。
在滑动窗口以外的部分包括尚未发送的数据以及已经确认对端已收到的数据。当数据发出后若如期收到确认应答就可以不用再进行重发,此时数据就可以从缓存区清除。
收到确认应答的情况下,将窗口滑动到确认应答中的序列号的位置。这样可以顺序地将多个段同时发送提髙通信性能。这种机制也被称为滑动窗口控制。
6. 4.7窗口控制与重发控制
在使用窗口控制中,如果出现段丢失该怎么办?
首先,我们先考虑确认应答未能返回的情况。在这种情况下,数据已经到达对端,是不需要再进行重发的。然而,在没有使用窗口控制的时候,没有收到确认应答的数据都会被重发。而使用了窗口控制,就如图6. 17所示,某些确认应答 即便丢失也无需重发。
其次,我们来考虑一下某个报文段丢失的情况。如图6. 18所示,接收主机如果收到一个自己应该接收的序号以外的数据时,会针对当前为止收到数据返回确认应答'
如图6. 18所示。当某一报文段丢失后,发送端会一直收到序号为1001的确 认应答,这个确认应答好像在提醒发送端“我想接收的是从1001开始的数据”。 因此,在窗口比较大,又出现报文段丢失的情况下,同一个序号的确认应答将会 被重复不断地返回。而发送端主机如果连续3次收到同一个确认应答' 就会将 其所对应的数据进行重发。这种机制比之前提到的超时管理更加高效,因此也被 称作
髙速重发控制。
6.4.8流控制
发送端根据自己的实际情况发送数据。但是,接收端可能收到的是一个毫无关系的数据包又可能会在处理其他问题上花费一些时间。因此在为这个数据包做其他处理时会耗费一些时间,甚至在高负荷的情况下无法接收任何数据。如此一来,如果接收端将本应该接收的数据丢弃的话,就又会触发重发机制,从而导致网络流量的无端浪费。
为了防止这种现象的发生,TCP提供一种机制可以让发送端根据接收端的实际接收能力控制发送的数据量。这就是所谓的流控制。它的具体操作是,接收端主机向发送端主机通知自己可以接收数据的大小,于是发送端会发送不超过这个限度的数据。该大小限度就被称作
窗口大小
。在前面6.4.6节中所介绍的窗口大小的值就是由接收端主机决定的。.
TCP首部中,专门有一个字段用来通知窗口大小。接收主机将自己可以接收的缓冲区大小放入这个字段中通知给发送端。这个字段的值越大,说明网络的吞吐量越高。
不过,接收端的这个缓冲区一旦面临数据溢出时,窗口大小的值也会随之被
设置为一个更小的值通知给发送端,从而控制数据发送量。也就是说,发送端主机会根据接收端主机的指示,对发送数据的量进行控制。这也就形成了一个完整的TCP流控制(流量控制)。
如图6. 19所示,当接收端收到从3001号开始的数据段后其缓冲区即满,不 得不暂时停止接收数据。之后,在收到发送窗口更新通知后通信才得以继续进行。 如果这个窗口的更新通知在传送途中丢失,可能会导致无法继续通信。为避免此 类问题的发生,发送端主机会时不时的发送一个叫做窗口探测的数据段,此数据 段仅含一个字节以获取最新的窗口大小信息。
6.4.9拥塞控制
有了TCP的窗口控制,收发主机之间即使不再以一个数据段为单位发送确认应答,也能够连续发送大量数据包。然而,如果在通信刚开始时就发送大量数据,也可能会引发其他问题。
一般来说,计算机网络都处在一个共享的环境。因此也有可能会因为其他主机之间的通信使得网络拥堵。在网络出现拥堵时,如果突然发送一个较大量的数据,极有可能会导致整个网络的瘫痪。
TCP为了防止该问题的出现,在通信一开始时就会通过一个叫做慢启动的算法得出的数值,对发送数据量进行控制。
首先,为了在发送端调节所要发送数据的量,定义了一个叫做“拥塞窗口” 的概念。于是在慢启动的时候,将这个拥塞窗口的大小设置为1个数据段 (1MSS)T发送数据,之后每收到一次确认应答(ACK),拥塞窗口的值就加1。 在发送数据包时,将拥塞窗口的大小与接收端主机通知的窗口大小做比较,然后 按照它们当中较小那个值,发送比其还要小的数据量。
如果重发采用超时机制,那么拥塞窗口的初始值可以设置为1以后再进行慢 启动修正。有了上述这些机制,就可以有效地减少通信开始时连续发包T导致的网络拥堵,还可以避免网络拥塞情况的发生。
不过,随着包的每次往返,拥塞窗口也会以1、2、4等指数函数的增长,拥 堵状况激增甚至导致网络拥塞的发生。为了防止这些,引入了慢启动阀值的概念。 只要拥塞窗口的值超出这个阀值,在每收到一次确认应答时,只允许以下面这种 比例放大拥塞窗口: