TCP交互状态示意图
问题来源
毫无疑问,TCP中有关网络编程最不容易理解的是它的TIME_WAIT状态。在图中我们看到执行主动关闭的那端经历了这个状态。该端点停留在这个状态的持续时间是最长分节生周期(maximumsegmentlifetime,MSL)的两倍,有时候称之为2MSL。
任何TCP实现都必须为MSL选择一个值。RFC1122[Braden1989]的建议值是2分钟,不过源自Berkeley的实现传统上改用30秒这个值。这意味着TIME_WAIT状态的持续时间在1分钟到4分钟之间。
TIME_ WAIT状态有两个存在的理由:
(1)可靠地实现TCP全双工连接的终止;
通过查看图2-5并假设最终的ACK丢失了来解释。服务器将重新发送它的最终那
个FIN,因此客户必须维护状态信息,以允许它重新发送最终那个ACK。要是客
户不维护状态信息,它将响应以一个RST(另外一种类型的TCP分节),该分
节将被服务器解释成一个错误。
如果TCP打算执行所有必要的工作以彻底终止某个连接上两个方向的数据流(即全双工关
闭),那么它必须正确处理连接终止序列4个分节中任何一个分节丢失的情况。本例子也说
明了为什么执行主动关闭的那一端是处于TIME_WAIT状态的那一端:因为可能不得不重传
最终那个ACK的就是那一端。
(2)允许老的重复分节在网络中消逝。
为理解存在TIME_WAIT状态的第二个理由,我们假设在12.106.32.254的1500端口和
206.168.112.219的21端口之间有一个TCP连接。我们关闭这个连接,过一段时间后在相同
的IP地址和端口之间建立另一个连接。后一个连接称为前一个连接的化身(incarnation),
因为它们的IP地址和端口号都相同。TCP必须防止来自某个连接的老的重复分组在该连接
已终止后再现,从而被误解成属于同一连接的某个新的化身。
为做到这一点,TCP将不给处于TIME_WAIT状态的连接发起新的化身。既然TIME_WAIT
状态的持续时间是MSL的2倍,这就足以让某个方向上的分组最多存活MSL秒即被丢弃,另
一个方向上的应答最多存活MSL秒也被丢弃。通过实施这个规则,我们就能保证每成功建立
一个TCP连接时,来自该连接先前化身的老的重复分组都已在网络中消逝了。
这个规则存在一个例外:
如果到达的SYN的序列号大于前一化身的结束序列号,源自Berkeley的实现将给当前处于TIME_WAIT状态的连接启动新的化身。TCPv2第958~959页对这种情况有详细的叙述。它要求服务器执行主动关闭,因为接收下一个SYN的那一端必须处于TIME_WAIT状态。rsh命令具备这种能力。RFC1185[Jacobson,Braden,andZhang1990]讲述了有关这种情形的一些陷阱。