HTTP
- 浏览器负责发起请求
- 服务器在 80 端口接收请求
- 服务器负责返回内容(响应)
- 浏览器负责下载响应内容
HTTP 的作用就是指导浏览器和服务器如何进行沟通。
请求示例
- curl -s -v -H "Frank: xxx" -- "https://www.baidu.com"
请求内容为
> GET / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.55.0
> Accept: */*
> Frank: xxx
>
这是向百度服务器发起请求,获取根目录,使用协议HTTP1.1,User-Agent表示用的什么软件发起请求,这里是用curl的 7.55.0版本。Accept: /表示接收所有。Frank: xxx无意义,表示在这个位置可添加内容。
- curl -X POST -s -v -H "Frank: xxx" -- "https://www.baidu.com"
请求内容为
> POST / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.55.0
> Accept: */*
> Frank: xxx
>
变了个POST
- curl -X POST -d "1234567890" -s -v -H "Frank: xxx" -- "https://www.baidu.com"
加数据的POST请求
多了上传内容的长度,上传的格式
请求格式
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据
请求的格式
- 请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
- 第三部分永远都是一个回车(\n)
- 动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
- 这里的路径包括「查询参数」,但不包括「锚点」
- 如果你没有写路径,那么路径默认为 /
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
curl -s -v -- "https://www.baidu.com/s?wd=JavaScript#4"
用 Chrome 发请求
打开 Network
地址栏输入网址
在 Network 点击,查看 request,点击「view source」
登陆一个账号试试, 勾上Preserve log,可以在FormData看到第四部分请求。
响应
前面的请求示例,前两个请求对应的响应分别为
< HTTP/1.1 200 OK
< Accept-Ranges: bytes
< Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
< Connection: Keep-Alive
< Content-Length: 2443
< Content-Type: text/html
< Date: Fri, 10 Aug 2018 13:21:13 GMT
< Etag: "58860415-98b"
< Last-Modified: Mon, 23 Jan 2017 13:24:37 GMT
< Pragma: no-cache
< Server: bfe/1.0.8.18
< Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<
{ [1040 bytes data]
* Connection #0 to host www.baidu.com left intact
< HTTP/1.1 302 Found
< Connection: Keep-Alive
< Content-Length: 17931
< Content-Type: text/html
< Date: Fri, 10 Aug 2018 13:22:14 GMT
< Etag: "54d9749e-460b"
< Server: bfe/1.0.8.18
<
{ [3824 bytes data]
* Connection #0 to host www.baidu.com left intact
响应的格式
1 协议/版本号 状态码 状态解释
2. Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
- 状态码要背,是服务器对浏览器说的话
- 1xx消息 不常用
- 2xx成功 表示成功
- 3xx重定向 表示滚吧
- 4xx客户端错误 表示你丫错了
- 5xx服务器错误 表示好吧,我错了
- 状态解释没什么用
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
- 第 2 部分中的 Content-Type 遵循 MIME 规范
具体HTTP状态码说明,HTTP状态码
如何使用 curl 命令
常见curl 命令
-v/--verbose 小写的v参数,用于打印更多信息,包括发送的请求信息,这在调试脚本是特别有用。
-m/--max-time <seconds> 指定处理的最大时长
-H/--header <header> 指定请求头参数
-s/--slient 减少输出的信息,比如进度
--connect-timeout <seconds> 指定尝试连接的最大时长
-x/--proxy <proxyhost[:port]> 指定代理服务器地址和端口,端口默认为1080
-T/--upload-file <file> 指定上传文件路径
-o/--output <file> 指定输出文件名称
-d/--data/--data-ascii <data> 指定POST的内容
--retry <num> 指定重试次数
-e/--referer <URL> 指定引用地址
-I/--head 仅返回头部信息,使用HEAD请求