240 发简信
IP属地:浙江
  • 记录鼠标滑动轨迹,并用selenium按照保存的轨迹滑动

    此文章不写具体实现方法,只提供思路。 实现目标: 首先是某网站存在一个滑动验证码。然后需要滑动。不能每次滑动都一样。 首先记录人的滑动轨迹 这里参考自博客 得到轨迹后模拟移动...

  • 爬虫 手机短信验证码

    手机短信验证是一个比较麻烦的问题,如果要构建cookies池,大量登陆又需要短信验证,也不能一直手动输入,所有就要想办法解决了。用一个短信转发app,将手机短信验证码转发到微...

  • 布隆过滤器

    scrapy-redis占用内存,目前两千万的redis去重队列+mongodb的缓存,15g的内存有点坚持不住了,不知道是不是我的程序有问题,感觉不应该这么快内存就不够用了...

  • 240
    itchat微信自动登陆库遇到的一些问题

    1.pip install itchat的时候提示字符解码错误 解决方法: 定位到对应文件的对应行,将decode里面的utf-8改成cp936 修改文件名:lib\site...

  • 240
    爬虫 之 打码平台

    爬虫验证码中还是有很多的特别难破解的,比如BT的12306 哈哈~,是不是被难倒了,没关系,这次说的是打码平台,可以有效解决这类问题。 这次主要说说超级鹰:http://ww...

  • 240
    猫眼爬虫 之 字体加密

    猫眼电影的字体加密还是很折磨人的(最后会附上源码,中间讲解部分就用截图代替) 准备部分 猫眼电影主要在于字体加密,如何破解?需要准备点东西:FontCreator,这是一个软...

  • 240
    淘宝爬虫 之 登陆验证(一)

    淘宝作为一大电商网站,反爬措施还是相当的完善的 输入账号密码,先别着急点击登陆,需要准备一下;开发者模式找到网络,点击持续更新日志,否则是找不到登陆页面的 接下来点击登陆,会...

  • 240
    爬虫 之 手机app配置

    首先需要一个抓包工具,fiddler 打开设置 然后按照图片将设置设置完成,图片1-2点击actions的第一个选项, 然后一路yes 到这里fiddler算是配置好了,下面...