计算机网络中的带宽、交换结点中的缓存和处理机等,都是网络的资源。在某段时间,若对网络中某一资源的需求超过了该资源所能提供的可用部分,网络的性能就会变坏。这种情况就叫做拥塞。
拥塞控制就是防止过多的数据注入网络中,这样可以使网络中的路由器或链路不致过载。和流量控制不同,拥塞控制是一个全局性的过程,而流量控制是点对点通信量的控制。
慢启动算法与拥塞避免算法
拥塞避免算法的前提是:假定由于分组受到损坏引起的丢失是非常少的,因此分组丢失(发生超时和接收到重复的确认)就意味着在源主机和目的主机之间的某处网络发生了拥塞
慢启动算法为发送方的TCP增加了另一个窗口:拥塞窗口,记为cwnd。
与另一个网络的主机建立TCP连接时,拥塞窗口被初始化为1个报文段(即另一端通告的报文段大小),每收到一个ACK,拥塞窗口就增加一个报文段。
实现
为了防止cwnd增长过大引起网络拥塞,还需设置一个慢开始门限ssthresh状态变量。
ssthresh 的用法如下:
- 当cwnd < ssthresh时,使用慢开始算法。
- 当cwnd > ssthresh时,改用拥塞避免算法。
- 当cwnd = ssthresh时,慢启动与拥塞避免算法任意。
无论是在慢开始阶段还是在拥塞避免阶段,只要发送方判断网络出现拥塞(其根据就是没有收到确认ACK,虽然没有收到确认可能是其他原因,但是因为无法判定,所以都当做拥塞来处理),就把慢开始门限设置为出现拥塞时的发送窗口大小的一半。然后把拥塞窗口设置为1,执行慢开始算法。
快速重传算法
超时重传是TCP协议保证数据可靠性的一个重要机制,其原理是在发送一个数据以后就开启一个计时器。在一定时间内如果没有得到发送数据报的ACK报文,那么就重新发送数据,直到发送成功为止。
这是数据包丢失的情况下给出的一种修补机制。一般来说,重传发生在超时之后,但是如果发送端接收到3个以上的重复ACK,就应该意识到,数据丢了,需要重新传递。这个机制不需要等到重传定时器溢出,所以叫做快速重传。
而快速重传以后,因为走的不是慢启动而是拥塞避免算法,所以这又叫做快速恢复算法。
- 为什么需要收到3个以上的重复ACK,才会执行快速重传?
在没有快速重传和快速恢复的算法之前,重传依靠发送方的retransmit timeout,就在timeout内如果没有接收到对方的ACK,默认包丢失,发送方就重传。
包丢失的原因:
- 包 checksum 出错
- 网络拥塞
- 网络断,包括路由重收敛。
但是无法判断是 哪一种算法,于是采用最笨的方法,就是将自己的发送速率减半,即cwnd/2,这样的方法对2是有效的。可以缓解网络拥塞。
但是对于1来说,丢包是因为偶尔出错引起的,一丢包就对半减速不合理。于是有了快速重传算法,基于在反向还可以接收到ACK,可以认为网络并没有断,否则也接收不到ACK,如果在timeout时间内没有接收到>2的重复的 ACK,则大概率是乱序。而如果收到3个或2个以上的duplicated ACK,则大概率是丢包。