在上篇文章中的httpClient整体执行流程中可以看到,在发起请求之前通过HttpConnectionManager.getConnectionWithTimeout来获取连接。结合下面的模型关系图会比较好理解HttpClient、HttpConnectionManager之间的关系。
这里的代码分析是基于httpClient3.1版本
从类关系图可以看到,HttpClient最终是通过connectionManager来做连接管理的,底层的连接是维护在ConnectionPool中的。
HttpClient有三种ConnectionManager实现: SimpleConnectionManager、MultiThreadedConnectionManager、DummyConnectionManager实现。其中SimpleConnectionManager和DummyConnectionManager对连接的管理比较简单,每次请求过来如果没有连接则创建新的连接。而MultiThreadedConnectionManager则会使用ConnectionPool来复用连接。
同时MultiThreadedConnectionManager的freeConnection是将连接释放到连接池中,即添加到freeConnections队列中,而SimpleConnectionManager在isAlwaysClose=true是在每次请求完成后关闭连接;否则不关闭连接,仅关闭响应输入流。
那获取连接的流程是怎么样的呢?
从上面的流程可以看到,httpClient会先尝试获取空闲连接,如果有空闲连接,则会直接获取空闲连接。否则,会根据maxHostConnections和maxTotalConnectionsc配置来获取连接。
在host连接数小于maxHostConnections并且总连接数小于maxTotalConnections时,直接创建新的连接比较好理解。
当host连接数小于maxHostConnections,但总连接数已经超过maxTotalConnections时,并且存在总空闲连接时,需要先释放最近在使用的空闲连接,为当前host创建新的连接。因为存在空闲连接,但总的连接数不够了,说明有其他host创建的连接数暂用了总的连接数,但存在空闲连接,没有使用,为避免资源浪费,需要先释放空闲连接,这样同时能保证总连接数不变。
这里有好几个概念host空闲连接,host连接数,要理解这些概念,需要理解connectionPool的数据结构。
从上图的连接池的数据结构可以看出,每个host都有维护自己的LinkedList类型的freeConnection(空闲连接集合)和int 类型的numConnections(创建的连接数),同时ConnectionPool也有维护自己的freeConnection,numConnections,ConnectionPool的freeConnection包含所有host的freeConnection,numConnections等于所有host的numConnections之和。
总结一下:HttpClient的ConnectionPool针对每个host有自己的pool,这个比较好理解,因为不同的host的连接不能复用。同时每个host pool都有最大连接数限制,所有pool的连接数之和也有限制,为避免连接资源占用耗尽。