1、会话对象
会话保持:在同一session实例之间会保持cookie(非发起请求时设置的方法级参数)
发起请求时设置的方法层的参数覆盖会话的参数。但若是单独指定设置,而非在发起请求时设置参数指定,会与已设置的会话层数据合并
s=requests.session()
s.headers.update({"k1":"v1"})
r=s.get("http://httpbin.org/headers",headers={"k2":"v2"})
print(r.text)
即使使用了会话,在前一请求发起时指定的方法级中的cookie,在下一请求中不会生效
如果要为会话设定cookies,可使用上下文管理器,保证在with块中的都是同一cookies。退出with区块会话关闭
with requests.Session() as s:
s.get('http://httpbin.org/cookies/set/sessioncookie/123456789')
2、请求与响应:
响应中包含请求对象,可通过响应获得请求对象 r.request.headers
3、PreparedRequest???
4、https请求,SSL证书验证
可以在调用发起请求时,设置verify,可以传入CA证书的路径,也可设置为flase则忽略证书验证,默认是true,使用的是requests自带的被信任的根证书,来自Mozilla trust store,也可在系统中安装certifi定时更新证书
也可以设置整个会话的证书,调用s.verfiy=证书路径
5、控制响应工作流:
可在发起请求时设置stream=True,推迟下载响应体内容,直到访问response.content响应内容属性,或使用iter_content(chunk_size)方法指定下载字节数(一块一块下载)或iter_lines()(一行一行下载)遍历响应内容时才开始下载。
开启此设置开启需要调用response.close手动释放连接,或使用上下文管理器
with requests.get('http://httpbin.org/get', stream=True) as r:
# 在此处理响应。
未开启stream的连接,将在使用response.content之后自动释放连接
6、大文件支持上传流
with open('massive-body') as f:
requests.post('http://some.url/streamed', data=f)
7、一个请求发送多个文件
将文件加入到元祖列表中,元祖格式为(form_field_name, file_info):
url = 'http://httpbin.org/post'
multiple_files = [
('images', ('foo.png', open('foo.png', 'rb'), 'image/png')),
('images', ('bar.png', open('bar.png', 'rb'), 'image/png'))]
r = requests.post(url, files=multiple_files)
8、事件挂钩
可以使用钩子,操控发送请求过程或处理信号,发送请求时,指定hooks参数,值为字典{钩子名字:回调函数},如:携带hooks=dict(response=print_url)
9、代理
可在发送请求前,使用proxies参数指定代理地址,类型为字典:{"http":"XX"},也可指定某一请求需要使用代理proxies = {'http://10.20.1.128': 'http://10.10.1.10:5323'}