概述:我们在网址中输入域名,首先会经过DNS的域名解析拿到具体的ip地址。随后客户端和服务端开始通过三次握手来开始建立连接,连接建立成功之后,客户端将包装好的http请求传输到服务端,服务端处理后再将数据返回给客户端。当客户端或者服务端不再有数据需要发送给对方的时候,就会开始发起四次回收以断开连接。
三次握手
解释一下几个表示位:
SYN(synchronous建立联机)
ACK(acknowledgement 确认)
PSH(push传送)
FIN(finish结束)
RST(reset重置)
URG(urgent紧急)
Sequence number(顺序号码)
Acknowledge number(确认号码)
第一次握手客户端需要发送一个syn=1告诉服务端需要联机,并且会同时发送一个随机生成的顺序号码(seq)。
第二次握手由服务端发起,服务端需要回复客户端一个确认ACK,这个值为第一次客户端生成的顺序号码加1,另外也生成一个随机顺序号码给到客户端。
第三次握手由客户端收到第二次握手的消息后,回复服务端一个确认消息ACK,这个值为服务端的顺序号码加1,也会发送一个seq。
很容易理解三次握手,第一次握手,是客户端需要确认自己发消息没问题,服务端收到消息以后证明自己收消息没问题,这时他还需要证明自己发消息没问题所以他发起第二次握手,客户端收到第二次握手的消息后确认了自己的发消息和收消息都没问题,但这时候服务端只知道自己收消息没有问题,他第二次发出的消息他并不知道客户端是否成功接收了,所以有了第三次握手,告诉服务端我收到了,你发消息没毛病。这时,就证明了客户端和服务端双方的收发都没有问题。
*syn攻击:伪造大量不存在的ip向服务端发送请求,第一次握手完成以后,使服务端进入半连接状态,服务端回复的消息得不到客户端的确认,服务端会反复确认,使得连接队列一直被占用,正常的连接反而进不来。
HTTP请求报文
相信大多数开发有过f12,然后network下面看请求和调用http接口时检查请求报文的经历。其实一个HTTP请求报文由请求行(request line)、请求头部(header)、空行和请求数据4个部分组成。
1.请求行
请求行分为三个部分:请求方法、请求地址和协议版本
请求方法
最常的两种get和post。
请求地址:就是URL
协议版本:如HTTP/1.0和HTTP/1.1
2.请求头
常见的为:
3.请求参数
需要注意的是get的参数带在url后面并不在这里。
数据送入协议栈
当应用程序用TCP传送数据时,数据被送入协议栈中,然后逐个通过每一层直到被当作一串比特流送入网络。其中每一层对收到的数据都要增加一些首部信息。
当目的主机收到一个以太网数据帧时,数据就开始从协议
栈中由底向上升,同时去掉各层协议加上的报文首部。每
层协议盒都要去检查报文首部中的协议标识,以确定接收
数据的上层协议。
HTTP响应报文
HTTP响应报文主要由状态行、响应头部、空行以及响应数据组成。
状态行
由3部分组成,分别为:协议版本,状态码,状态码描述。
其中协议版本与请求报文一致,状态码描述是对状态码的简单描述,所以这里就只介绍状态码。
状态代码为3位数字。
1xx:指示信息--表示请求已接收,继续处理。
2xx:成功--表示请求已被成功接收、理解、接受。
3xx:重定向--要完成请求必须进行更进一步的操作。
4xx:客户端错误--请求有语法错误或请求无法实现。
5xx:服务器端错误--服务器未能实现合法的请求。
四次挥手
通过前面,我们已经知道ACK是用来应答的,SYN是用来代表连接的。而这里的FIN报文就是代表断开连接的,当主动方没有数据再需要传输给对方时,会向对方发起FIN报文,但这时候被动方不会立马断开连接,他只会回复一个ACK告诉主动方你发的FIN报文我收到了,很可能不会立马关闭,因为他可能还没处理完请求,可能还有消息需要发送,这时主动方进入FIN_WAIT_2状态。等被动发也没有消息需要发送了,这时候才会也发一个FIN给主动方,主动方回复以后,连接断开。
COOKIE
Http 协议中引入了 cookie 技术,用来解决 http 协议无状态的问题。通过在请求和响应报文中写入 Cookie 信息来控制客户端的状态;Cookie会根据从服务器端发送的响应报文内的一个叫做 Set-Cookie 的首部字段信息,通知客户端保存 Cookie。当下次客户端再往该服务器发送请求时,客户端会自动在请求报文中加入 Cookie 值后发送出去。在基于 tomcat 这类的 jsp/servlet 容器中,会提供 session 这样的机制来保存服务端的对象状态。