极验破解尝试

简述

  • 在简书-爬虫数据分析学习交流 群里有个哥们 🏿I 🏿(。。他的微信昵称直接粘贴过来就是这样的。。)展示了他的极验验证码破解效果,很流畅,引起了我的兴趣。
  • 极验验证码的主要问题在于对人的行为特征的分析,它会在你拖动滑块时以数十毫秒间隔记录你的鼠标移动数据发送到服务器,并使用各种算法(如深度学习)判断你的轨迹特征到底是人还是机器。
  • 我突然想到pid模型说不定能模拟人的行为特征,就想试试。
  • 实现思路上大家都差不多,简单的方案就是selenium操纵浏览器,由原始图和凹陷图对比得出要移动的距离,然后控制鼠标以某种方案移动即可。(图片的获取有两种方案,一是向服务器请求图片片段,然后拼接起来,我选择了另一种懒办法,在三种情况下截图对比)
  • 难一些的思路就是抓包分析,直接请求服务器,发送鼠标轨迹数据,网上有大神直接抓包分析发送xpos数据的样例,详见参考。
  • 🏿I 🏿哥们说他的正确率在90%以上,感谢他的热心交流,虽然没有透露他的具体方案 :) (当然,这种东西不好说的)
  • 我的成功率不高,要是高了就不太方便写博客了。成功率在40、50%吧,所以我放心地贴出来,仅供学习探索参考,而且极验的3.0也在推进,感觉样式还不错。
  • 我将我搜集到的有用资源都列在参考里了,网上分享的经验和代码不少,上手还是比较快的,演示视频中的代码也放上了,在github-geetest里直接附上了chromedriver可能更方便点,有兴趣的朋友可以试着玩玩,调下参数。还试了些其他的,比较乱,就没放上了。
  • 我觉得这个对于搞机器学习的朋友会比较有吸引力,毕竟手里有个锤子,看啥都是钉子。现在这么好的陪练出来了,一攻一防,不过注意分寸吧。。。在代码中搜索到get_offsets用你自己的思路复写它,返回一个可迭代对象表示鼠标每次平移间隔即可。192行的间隔时间也可相应修改。

效果

参考

视频中代码

# -*- coding: utf-8 -*-
import os
import time
from selenium import webdriver
from io import BytesIO

from PIL import Image
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


os.chdir('.')

driver = webdriver.Chrome('./chromedriver.exe')
driver.get("https://www.jianshu.com/sign_in")

while 1:

    time.sleep(0.2)
    # 设定窗口大小
    width = 1280
    height = 800
    driver.set_window_size(width, height)

    def get_captcha_image(filename):

        screenshot = driver.get_screenshot_as_png()
        screenshot = Image.open(BytesIO(screenshot))
        # screenshot.show()

        captcha_el = driver.find_element_by_class_name("gt_box")
        location = captcha_el.location
        size = captcha_el.size
        left = location['x']
        top = location['y']
        right = location['x'] + size['width']
        bottom = location['y'] + size['height']
        box = (left, top, right, bottom)
        print(box)
        if box[0] == 0:
            raise(Exception('======='))
        captcha_image = screenshot.crop(box)
        captcha_image.save(filename)  # "%s.png" % uuid.uuid4().hex
        print(u'截图成功')

    time.sleep(1)
    WebDriverWait(driver, 8).until(
        EC.presence_of_element_located((By.CLASS_NAME, "gt_box")))
    knob = driver.find_element_by_class_name("gt_slider_knob")
    action = ActionChains(driver)
    action.move_to_element_with_offset(knob, 21, 21).perform()
    time.sleep(1)
    f_file = 'f-%s.png' % time.strftime("%Y%m%d-%H%M%S")
    get_captcha_image(f_file)
    ActionChains(driver).click_and_hold().perform()
    time.sleep(0.5)
    # action.drag_and_drop_by_offset(knob, x_offset, y_offset).perform()
    s_file = 's-%s.png' % time.strftime("%Y%m%d-%H%M%S")
    get_captcha_image(s_file)
    # action.move_by_offset(50, 0).release().perform()
    # action.reset_actions()

    # --------------------------------------------------------------
    import matplotlib.pylab as plt
    from PIL import Image, ImageFilter
    from PIL import ImageChops 

    # 直观感受图片差异
    image_f = Image.open(f_file)
    image_s = Image.open(s_file)
    diff = ImageChops.difference(image_f, image_s)

    # ----------------------显示图片debug----------------------------
    '''
    # if diff.getbbox() is not None:
    diff.save('x.png')
    # plt.imshow(plt.imread('x.png'))
    # plt.show()

    fig, axs = plt.subplots(nrows=1, ncols=3)
    for im, ax in zip(["f.png", "s.png", "x.png"], axs):
        image = plt.imread(im)
        ax.imshow(image)
    plt.show()

    diff_image = Image.open('x.png')
    '''
    # -------------------------debug--------------------------------
    global first_left
    first_left = 0

    def find_offset(diff_image, offset_=62):

        d = diff_image.convert("L").point(lambda i: i > 52, mode='1')
        d.save('x-%s.png' % time.strftime("%Y%m%d-%H%M%S"))
        b1 = d.getbbox()  # left, upper, right, and lower pixel coordinate
        # offset_ = 65
        b2 = d.crop((offset_, 0, d.width, d.height)).getbbox()
        global first_left
        first_left = b1[0]
        offset = b2[0] + offset_ - b1[0] - 2
        if b2[0] <= 4:
            offset = -1
        return offset
        # diff = diff_image.load()
        # http://stackoverflow.com/questions/9038160/break-two-for-loops
        # for x in range(61, width):
        #     for y in range(height):
        #         if all(i > 40 for i in diff[x, y]):
        #             return x - 6

    offset = find_offset(diff)
    if offset < 0:
        # 拖动滑块到右方160像素处保持并截图
        ActionChains(driver).move_by_offset(160, 0).perform()
        time.sleep(0.5)
        # action.drag_and_drop_by_offset(knob, x_offset, y_offset).perform()
        s_file = 's-%s.png' % time.strftime("%Y%m%d-%H%M%S")
        get_captcha_image(s_file)
        # 放下
        ActionChains(driver).release().perform()
        image_s = Image.open(s_file)
        diff = ImageChops.difference(image_f, image_s)
        d = diff.convert("L").point(lambda i: i > 60, mode='1')
        offset = d.getbbox()[0] - first_left
        time.sleep(2.5)
        ActionChains(driver).move_to_element_with_offset(
            knob, 21, 21).click_and_hold().perform()
        time.sleep(0.5)
    print(offset)

    def get_offsets(setpointX):
        '''
        切记不能移动小数个像素位置
        '''
        kp = 3.0
        ki = 0.0001
        kd = 80.0

        x = 0
        vx = 0
        prevErrorX = 0
        integralX = 0
        derivativeX = 0

        while 1:
            if x >= setpointX:
                break

            errorX = setpointX - x
            # print('xxxxx - ', x)
            integralX += errorX
            derivativeX = errorX - prevErrorX
            prevErrorX = errorX
            if offset < 100:
                K = 0.007
            elif offset < 180:
                K = 0.006
            else:
                K = 0.005
            ax = K * (kp * errorX + ki * integralX + kd * derivativeX)
            vx += ax

            if x + vx > setpointX:
                vx = setpointX - x
            vx = int(vx)
            if vx < 1:
                vx = random.randint(1, 3)
            yield vx
            print('vvvvv - ', vx)
            x += vx

    def get_offsets_back(goal):

        x = 0
        while 1:
            if x >= goal:
                break
            dx = random.randint(10, 50)
            if x + dx > goal:
                dx = goal - x
            yield dx
            x += dx

    import random
    for o in get_offsets(offset):
        y = random.randint(-1, 1)
        ActionChains(driver).move_by_offset(o, y).perform()
        # time.sleep(0.03)
        time.sleep(random.randint(2, 4) / 100)
    ActionChains(driver).release().perform()
    # action.drag_and_drop_by_offset(knob, offset, 0).perform()
    time.sleep(3)
    driver.refresh()

其它


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容