协议:计算机通讯网络中两台计算机之间进行通信所必须的共同遵守的规定或者规则
HTTP协议:超文本传输协议HTTP是一种通信协议,它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器
URI:Uniform Resource Identifier,统一标识符,用来唯一的标识一个资源
比如网上的图啊视频啊什么的资源,这些资源都是用URI来标记定位的。
file://a:123/b/c/d.txt这个使用http协议表示这个资源在a主机的123端口的b目录下的c目录的d.txt文件
URI的三个组成部分
- 访问资源的命名机制
- 存放资源的主机名
- 资源资深的名称,由路径表示,注重强调资源
URL:Uniform Resource Locator,统一资源定位器,它是一种具体的URI,即URL可以用来标识一个资源,而且还知名了如何locate这个资源
比如 http://www.jianshu.com/u/c1f9e6ee52f7 这个网址就是一个URL
URL的三个组成部分
①协议(http,https)
②存有该资源的主机IP地址
③主机资源的具体地址,注重强调路径
HTTP协议的特点
①简单快速。只需要写请求路径和方法(post,get)就能获取数据
②无连接。限制每次链接只处理一个请求,服务器处理完客户端的请求后受到客户端的应答,然后就断开连接
③无状态。协议对以前处理的请求是没有记忆的
request / response 原理
当打开浏览器,在地址栏中输入URL,然后我们就看到了网页。这个原理是怎样的呢?
当我们的浏览器输入完URL后,浏览器就给服务器发送了一个request(可能经过代理服务器)请求,服务器收到浏览器的request请求后就会进行相应的处理,生成相应的response返回给浏览器,浏览器收到response中的HTML文档,这样我们就看见了网页。
PS:代理服务器可以提高访问速度,代理服务器具有缓存功能,当再次访问前一个地址时候,就可以直接从代理服务器中获取,而不用再去请求Web服务器。
request请求头(1-10)
- 1.告诉我们访问方法为get,访问的是一个.js的文件,协议是HTTP1.1
- 2.Host告诉我们请求的主机和端口号,主机是前面网址,端口号是8080。通常这个信息是从URL中提取出来的。端口号有时可以省略,如省略就用默认值80
- 3.User-Agent 是告诉http服务器,客户端所采用操作系统浏览器名称及版本
- 4.Intervention是服务器的信息,但该字段并不是通用的请求头
- 5.Accept表示浏览器端可接受的媒体类型图例/通配符表示可以接受任意类型,可以处理所有类型数据,一般情况都会返回这个
- 6 . referer是一个引用,浏览器告诉服务器,这个请求是从哪个页面链接过来的
- 7.Accept-Encoding指浏览器声明自己的一些编码方法,通常是是否可以执行压缩等等。。
- 8.Accept-Language浏览器声明自己可以解释的语言和字符集
- 9.if-None-Match与response中的15ETag联合使用,功能是告诉response可以添加一些ETag进去,当再次请求的时候,比对ETag如果没有发生变化,response会返回状态码304,这时浏览器可以直接使用本地的缓存,大大提升了性能和用户体验
- 10.if-Modified-Since把浏览器端缓存命令的最后修改时间发送到服务端去,服务器会把这个时间与服务器的最后修改时间对比,如果一致,就是304,那么还是告诉浏览器可以直接使用本地缓存。如果不一致返回200,表示请求成功和新的文件内容,客户端收到后会丢弃掉原来的缓存文件,同时会把新的内容缓存到本地并显示在浏览器
response头(11-18)
- 11.返回协议和状态码
- 12 . Server返回HTTP服务器的软件信息
- 13.Date生成reponse的具体时间
-14.Last-Modified资源最后的修改时间,与request的10if-Modified-Since对应
-15.ETag与request的9if-None-Match对应,标识服务器信息的标志位
-16.Expires表示浏览器在指定时间内使用本地缓存
-17.Cache-Control表示指定response和request所遵循的缓存机制
-18.Proxy-Connection代理链接,Keep-alive表示当一个网页打开后,客户端和服务端直接传输数据的TCP连接不会关闭,如果客户端再次访问服务端的网页连接,那么会继续使用这条已经建立好的TCP连接,而不会重新建立一个连接,这样会对网络连接资源有个优化提升