一、获取IP地址
通过DNS将URL解析成IP地址
IP地址对应一台真实的物理机器,而且IP地址就像人的身份证是唯一的,用户请求服务器,只需要输入为该服务器分配的唯一的IP地址即可。但由于IP地址不便于记忆,因而使用较为语义化的域名来替代IP地址,而且一个域名可能对应了对个IP地址,比如用户输入www.baidu.com
,该域名下对应了多个IP,域名解析服务器会根据一定的规则分配给用户其中一个IP地址。
DNS解析过程:
- 向
浏览器的缓存
中查找;如果没有则进行下一步; - 向
系统缓存(本地的hosts文件)
中查找;如果没有则进行下一步; - 向
路由器
查询DNS缓存;如果没有则进行下一步; - 向
ISP(运营商)DNS缓存
中查找(比如电信)如果没有则进行下一步; - 向
根域名服务器
=>顶级域名服务器
中查找
tips:这里使用 DNS预解析
,可以根据浏览器定义的规则,提前解析之后可能会用到的域名,使解析结果缓存到系统缓存中,缩短DNS解析时间,来提高网站的访问速度。
二、TCP/IP三次握手建立连接
知道了服务器的IP地址后,浏览器利用tcp协议通过三次握手与服务器建立连接
建立连接需要三个过程(三次握手):
- 客户机向服务器发送一个建立连接的请求(客户机向服务器拨打电话)
- 服务器接到请求后发送同意连接的信号(服务器接听电话)
- 主机接到同意连接的信号后,再次向服务器发送了确认信号(客户机:“喂喂喂,听得到吗?”)
为什么要进行三次握手?如果是两次握手,如下面的对话只有前两句,有可能出现的问题是:客户端之前发送了一个连接请求报文,由于网络原因滞留在网络中,后来到达服务器端,服务器接收到该请求,就会建立连接,等待客户端传送数据。而此时客户端压根就不知道发生了什么,白白造成了服务器资源浪费。
三、浏览器向web服务器发送http请求
客户机与服务器建立TCP/IP连接后就可以通信了。
-
浏览器根据解析到的IP地址和端口号发起HTTP请求,HTTP请求包括header和body。header中包括请求的方式(get和post)、请求的协议 (http、https、ftp)、请求的地址ip、缓存cookie。body中有请求的内容。例如:
GET https://www.google.com/ HTTP/1.1
- 服务器接到请求后,会根据 HTTP 请求中的内容来决定如何获取相应的 HTML 文件
- 服务器将得到的 HTML 文件发送给浏览器
.
get会产生一个tcp数据包,post则是两个(GET和POST最详细的总结传送门)
- get请求时,浏览器会把headers和data一起发送出去,服务器响应200(返回数据),
- post请求时,浏览器先发送headers,服务器响应100 continue, 浏览器再发送data,服务器响应200(返回数据)。
.
客户端请求静态资源和动态资源:
- 静态资源:如果客户端请求的是静态资源,则web服务器根据URL地址到服务器的对应路径下查找文件,然后给客户端返回一个HTTP响应,包括状态行、响应头和响应正文。
- 动态资源:如果客户端请求的是动态资源,则web服务器会调用CGI/VM执行程序完成相应的操作,如查询数据库,然后返回查询结果数据集,并将运行的结果--HTML文件返回给web服务器。Web服务器再将HTML文件返回给用户。
四、浏览器渲染
浏览器拿到HTML文件后,根据渲染规则进行渲染:
- DOM 树:解析 HTML 构建 DOM(DOM 树)
- CSS 树:解析 CSS 构建 CSSOM(CSS 树)
- 渲染树:CSSOM 和 DOM 一起生成 Render Tree(渲染树)
- 布局(layout):根据Render Tree浏览器就知道网页中有哪些节点,以及各个节点与 CSS 的关系,从而知道每个节点的位置和几何属性
(重排)
- 绘制(Paint):根据计算好的信息绘制整个页面
(重绘)
五、四次挥手断开连接
客户端没有数据发送时就需要断开连接,以释放服务器资源。
- 客户端:我没有数据要发送了,打算断开连接
- 服务器:你的请求我收到了,我这还有数据没有发送完成,你等下
- 服务器:我的数据发送完毕,可以断开连接了
- 客户端:ok,你断开连接吧(客户端独白:我将在2倍的最大报文段生存时间后关闭连接。如果我再次收到服务器的消息,我就知道服务器没有收到我的这句话,我就再发送一遍)。
最终服务器收到该客户端发送的消息断开连接,客户端也关闭连接。