好久没有用过scrapy框架,甚至有一些手生了。学习东西最痛苦的事情是,学了的东西不用。过一段时间我都怀疑自己是否学过了。 还是古话说的好,温故...
头一段时间做了某网站的滑动验证码, 用的是阿里的滑动验证码。用自动化模拟滑块的拖动, 然而尝试了多种方法, 仍没能成功。最终得出结论,阿里的反爬...
模拟multipart/form-data请求 原以为requests请求十分强大, 但遇到了模拟multipart/form-data类型的p...
字体文件反爬 在搞定静态字库反爬之后, 可以解决部分字体文件的反爬, 但动态字文件反爬是解决不掉的。此文章就是为解决动态字体文件的反反爬而写。本...
ttf 文件反爬 想写这篇文章的起源是在一个技术群里,有人讨论去哪网(手机端)的反爬:请求下来的数字跟浏览器上的数字有规律的不同,查看字体文件之...
疑难杂项 这篇的文章没有归类,也不太好归类。 在爬虫中经常用到的问题点。 比如说编码问题, 编码问题在Python中简直就是一门玄学, 在爬虫中...
execjs 使用 1. 安装 2. 简单使用 需要注意的是: 个别的JS语句, 用execjs返回的结果跟浏览器环境返回的结果是有区别的, 以...
Chrome Headless使用 Chrome的安装与配置不在此赘述, 不过需要注意的是: 版本号与驱动的映射关系! 版本号与驱动的映射关系!...
xpath 高级用法 1. 匹配当前节点下的所有: .// 2. 匹配某标签的属性值: /@属性名称 3. 匹配多个路径:| 4.按属性匹配:@...
文集作者