HTTP协议的核心部分:它传输的报文内容
报文结构
HTTP协议也是与TCP/UDP类似,同样也需要在实际传输的数据前附加一些头数据,不过与TCP/UDP不同的是,它是一个“纯文本”的协议,所以头数据都是ASCII码的文本,可以很容易地用肉眼阅读,不用借助程序解析也能够看懂。
HTTP协议请求报文和响应报文的结构基本相同,由三大部分组成:
1.起始行(start line): 描述请求或响应的基本信息;
2.头部字段集合(header): 使用key-value形式更详细地说明报文;
3.消息正文(entity): 实际传输的数据,它不一定是纯文本, 可以是图片、视频等二进制数据
前两部分起始行和头部字段经常又合称为"请求头"或"响应头", 消息正文又称为"实体", 但与"header"对应,很多时候就直接称为"body"
HTTP协议规定报文必须有header,但可以没有body, 而且在header之后必须要有一个"空行", 也就是"CRLF", 十六进制的"0D0A"
请求行
请求报文的起始行也就是请求行, 简要描述了客户端想要如何操作服务器端的资源
请求行由三部分构成:
1.请求方法: 是一个动词,如GET/POST, 表示对资源的操作
2.请求目标: 通常是一个URI, 标记了请求方法要操作的资源
3.版本号: 表示报文使用的HTTP协议版本
这三个部分通常使用空格(space)来分隔, 最后要用CRLF换行表示结束
状态行
响应报文里的起始行,在这里不叫"响应行", 而是叫"状态行", 意思是服务器响应的状态
比起请求行来说, 状态行要简单一些,同样也是由三部分构成:
1.版本号: 表示报文使用的HTTP协议版本;
2.状态码: 一个三位数, 用代码的形式表示处理的结果,比如200是成功, 500是服务器错误
3.原因:作为数字状态码补充, 是更详细的解释文字,帮助人解释原因
头部字段
请求行或状态行再加上头部字段集合就构成了HTTP报文里完整的请求头或响应头
请求头和响应头的结构是基本一样的,唯一的区别是起始行,所以我把请求头和响应头的字段放在一起介绍
头部字段里是key-value的形式,key和value之间用":"分隔, 最后用CRLF换行表示字段结束。比如在“Host: 127.0.0.1”这一行里key就是“Host”,value就是“127.0.0.1”。
HTTP头字段非常灵活,不仅可以使用标准里的Host、Connection等已有头,也可以任意添加自定义头,这就给HTTP协议带来了无限的扩展可能。
使用头字段需要注意以下几点:
1.字段名不区分大小写,例如"Host"也可以写成"host", 但首字母大写的可读性更好
2.字段名里不允许出现空格,可以使用连字符“
-”,但不能使用下划线“_”。例如,“test-name”是合法的字段名,而“test name”“test_name”是不正确的字段名;
3.字段名后面必须紧接着":", 不能有空格, 而":"后的字段值前可以有多个空格
4.字段的顺序是没有意义的,可以任意排列不影响语义
5.字段原则上不能重复,除非这个字段本身的语义允许, 例如Set-Cookie
常用头字段
HTTP协议规定了非常多的头部字段, 基本上可以分为以下四类:
1.通用字段:在请求头和响应头里都可以出现;
2.请求字段:仅能出现在请求头里,进一步说明请求信息或者额外的附加条件;
3.响应字段:仅能出现在响应头里,补充说明响应报文的信息;
- 实体字段:它实际上属于通用字段,但专门描述body的额外信息