1.Requests库的POST方法进行表单交互
只需要简单的传递一个字典结构的数据给data参数即可使用。
爬取网站的登录,定位登录位置,利用chrome浏览器,点击右键-->检查,找到元素的位置
根据源代码,构造表单登录网页
import requests
url ="https://www.douban.com/accounts/login"
params = {
"source":"index_nav",
"form_email":"xxx",
"form_password":"xxx"
}
#form_email和form_password分别是账号和密码
html = requests.post(url,data=params)
print(html.text)
2.Cookie信息进行模拟登录
Cookie,指有些网站为了辨别用户身份、进行session跟踪而存储在用户本地终端上的数据。
手动输入账号和密码进行登录,在开发者工具中找到Network加载文件,在请求头中可以看到相应的Cookie信息。
在请求头headers中加入cookie信息即可完成网站的模拟登录
url ="https://www.douban.com/"
headers = {
'Cookie':'xxx'
}
html = requests.get(url,headers=headers)
print(html.text)