上回(Python实现电影排行榜自动网盘下载(4)Cookies免登录+抓包下载)说到,一段时间内能进行多少次离线下载还是受限于验证码的输入。
在此有两个解决方案,
- 见招拆招 通过GUI优化验证码输入
即使有验证码,在用户一直输入验证码的情况下也是很快的。而且可以借此学习Python是如何做出GUI程序的,学起来也会是很有价值的,参考 实验楼 给Python3爬虫做一个界面 以后有机会可能会写点类似的实验案例。 - 使用网盘客户端
这个解决方案的优点就是没有!验!证!码!缺点就是添加的速度视资源而定,如果违规资源较多,可能会导致频繁重启;再有其实这就是个按键脚本,采用模拟鼠标、键盘等操作,感觉比较脑残…
这篇文章记录了我第二种方法的实验过程,最后测试了几个磁力链接的添加速度,大概是这样的:
速度大概是每分钟10个,如果再慢的话从速度上可能第一种方案会是比较好的选择。
Pywinauto
先看看简介吧。pywinauto is a set of python modules to automate the Microsoft Windows GUI. At it’s simplest it allows you to send mouse and keyboard actions to windows dialogs and controls.
嗯,是个Windows的自动化操作工具。
帮助文档
要点一个按钮,首先要知道怎么找这个按钮吧?在这里他的一个示例是关于记事本的,学习了一下,大概是通过窗口类名和标题来找的元件,说到这里就要用到Spy++(或者Spy++Lite)
就这么拖一下就找出来了。
嘿嘿,初次用这个Pywinauto感觉还挺厉害的,然而我把他用到网盘上的时候…我就蒙蔽了- -,这个离线下载的按钮在Spy++Lite中找不到,换了其他各种找元件的工具都查不出来,Pywinauto输出这个主窗口包含的元件也不管用。网上查了一下这是为什么,可能是这个按钮他丫的就不是个标准的按钮!那该怎么办呢?
关于按钮的折腾
这一段着实是瞎折腾,最初的想法并没有成功,最终选择了鼠标模拟,发上来给大家参考参考吧,大家有指正或者好的改进方法快来告诉我呀~(所以大概这段可以跳过了?(划掉))
网上看到别的一个方案——窗口收到了什么消息,就模拟什么消息;收到了鼠标按下按键这个消息,就模拟这个消息。
于是又在Spy++里面瞎折腾,先打开百度云主窗口,然后在Spy++里面记录它收到的消息,找到了这么一条
离线下载这个按钮的功能就是激活这个新建的窗口,那我们拿到这个句柄(相当于窗口的身份)来激活,不就不用管这个按钮了吗?然而这个句柄是如何产生的呢?它到底是在按下按钮的一瞬间产生的,还是在按下之前就存的有呢?在Spy++中从按下鼠标之后截获到的消息并没有返回这个句柄,呵呵,我就天真地暂定它是之前就存的有吧。就算你存的有,那又该怎么找呢?嘿嘿,我想到了CheatEngine来搜索。
哇,这不是有规律嘛!第4位每次+1!
然而马上我又被打脸了…开个别的窗口再来开它,嗯……(手动再见)
好吧…我屈服了…就按照按键脚本来写吧…
后台鼠标消息
好了,现在开始试着写按键脚本…大致想法就是获得主窗口的句柄,用坐标的方式获得按钮的位置,然后模拟点击。这里可能用按键精灵的抓抓会比较方便。
在这里需要注意按键精灵抓出来的句柄是10进制的。
测试成功啦,看来可以用这个方法,那就一通写出来吧。
这里问题就是离线下载的地址填不进去!它就这么默默地看着你,一动不动!
按键精灵不行,试试Pywinauto?
移植到Python
……别试了,Pywinauto发送文本也不行。它们用的应该都是WIN API,所以应该换个思路了。在这里我的想法是模拟人操作,把地址Ctrl+C一下,然后到文本框Ctrl+V一下。在这里虽然Pywinauto有Ctrl+V,但却没有Ctrl+C(卧槽这是什么操作啊啊啊)还是用win api吧。注意这个SetClipboardData提到了一句,
必须用NULL结束字符串。使用此格式为ANSI文本。
所以我们在地址后面加上一句
.encode('ansi')
否则粘贴过去就是这样的
此外文本框还有一个坑,像上面那样查询链接失败的话地址就留在那里了,所以应该是Ctrl+A Ctrl+V。而文本框发送Ctrl+A Ctrl+V有的时候会Ctrl莫名奇妙失效,多出来一个a,粘贴过去是amagnet,所以在这里干脆都按照存在文字的情况处理,发送A Ctrl+A Ctrl+V
下一个窗口。
虽然可以按照偏移点击的方法解决,但同时我发现可以通过Tab Tab Enter的方式完成下载,或许以后遇见坐标偏移量是变化的时候可以尝试这种方法?
依次用鼠标点击指定坐标的方式到了最后一个窗口了,关掉这个窗口,就是脚本的一个循环啦。
总结
一开始我并不知道Pywinauto有后台鼠标消息,于是写了一个用winapi模拟点击的版本,也放上来吧。
from pywinauto import application
import win32api
import win32gui
import win32con
import win32ui
main_handle=win32ui.FindWindow('BaseGui','欢迎使用百度网盘').GetSafeHwnd()
client_pos=(516,118)
tmp = win32api.MAKELONG(client_pos[0], client_pos[1])
win32gui.SendMessage(main_handle, win32con.WM_ACTIVATE, win32con.WA_ACTIVE, 0)
win32api.SendMessage(main_handle, win32con.WM_LBUTTONDOWN, win32con.MK_LBUTTON, tmp)
win32api.SendMessage(main_handle, win32con.WM_LBUTTONUP, win32con.MK_LBUTTON, tmp)
这次实验还是有很多问题,包括Python实现电影排行榜自动网盘下载(3)Selenium离线下载同样出现的欲速则不达,所以最终代码中加入了wait_until;还有下载一定次数之后查询磁力链接没反应,重启客户端可解决;以及各种查询失败、离线下载错误……总之,应对错误的逻辑还有待改进,在这里只是简单的设定为add_task出现问题之后直接重启客户端,即查询不了下载信息就重启。还有其他情况没有处理,包括下载进度为0%,这种任务多了会提醒离线下载任务过多,需要手动清理,如果违规资源较多,可能导致重启频繁,影响速度。代码的话可能需要根据实际运行情况修改超时时间。由于速度过快经常容易查不到句柄啥的,就都用try except括起来了,感觉好丑却很无奈,献丑啦:
import pywinauto
import time
import win32clipboard as w
import win32con
from pywinauto.timings import *
from pywinauto.application import Application
class baidudisk:
def boot(self):
path=r'C:\Users\Administrator\AppData\Roaming\Baidu\BaiduNetdisk\BaiduNetdisk.exe'
#Python3 中Application要加()
self.baiduapp=Application().start(path)
try:
#规定时间内等待程序启动
wait_until(10,0.25,self.getmainui,True)
except Exception as e:
print('Get Main Window ')
print(e)
def kill(self):
self.baiduapp.kill()
def download(self,url):
#剪切板函数要求数据类型为ANSI
self.url=url.encode('ansi')
try:
wait_until(1,0.25,self.click_newtask,True)
except Exception as e:
print('Download button ')
print(e)
try:
wait_until(1,0.25,self.query_newtask,True)
except Exception as e:
print('Query')
print(e)
try:
wait_until(4,0.25,self.add_newtask,True)
except Exception as e:
print('Add task')
print(e)
print('Rebooting...')
self.baiduapp.kill()
self.boot()
try:
wait_until(3,0.25,self.close_state,True)
except Exception as e:
print('State Window')
print(e)
def click_newtask(self):
try:
self.main_ui.click(coords=(516,118))
return (True)
except Exception as e:
print(e)
return (False)
def query_newtask(self):
try:
newtask_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= "新建离线下载任务窗口")
newtask_ui=pywinauto.controls.hwndwrapper.DialogWrapper(newtask_handle)
url_ui=newtask_ui.descendants()[0]
# url_ui.set_keyboard_focus()
w.OpenClipboard()
w.EmptyClipboard()
w.SetClipboardData(win32con.CF_TEXT, self.url)
w.CloseClipboard()
url_ui.send_keystrokes('a^a^v')
# print(url_ui.element_info)
# print(url_ui.get_properties())
#添加磁力链接后下载
newtask_ui.click(coords=(470,255))
return (True)
except Exception as e:
print(e)
return (False)
def add_newtask(self):
try:
download_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= '新建离线BT任务')
download_ui=pywinauto.controls.hwndwrapper.DialogWrapper(download_handle)
download_ui.click(coords=(400,470))
#可能出现离线下载错误时该窗口不会正常关闭的情况 所以使用try
try:
download_ui.close()
except:
pass
return (True)
except Exception as e:
print(e)
return (False)
def close_state(self):
try:
state_handle=pywinauto.findwindows.find_window(class_name="BaseGui",title= '离线下载任务列表')
state_ui=pywinauto.controls.hwndwrapper.DialogWrapper(state_handle)
state_ui.close()
return (True)
except Exception as e:
print(e)
return (False)
def getmainui(self):
try:
#返回窗口句柄
self.baidudisk_handle=pywinauto.findwindows.find_window(class_name='BaseGui',title='欢迎使用百度网盘')
#根据窗口句柄查询对话框
self.main_ui=pywinauto.controls.hwndwrapper.DialogWrapper(self.baidudisk_handle)
return (True)
except Exception as e:
print(e)
return (False)
if __name__=='__main__':
bdtest=baidudisk()
bdtest.boot()
#正常与违规的链接均进行测试
magnets=[
'magnet:?xt=urn:btih:583bed331c32889897f69b114191c44732bb7aa2',
'magnet:?xt=urn:btih:FD351CACF9692E1833388B3B5A568C6A115E4672&xl=546661540&dn=[%E6%A5%9A%E9%97%A8%E7%9A%84%E4%B8%96%E7%95%8C].rmvb',
'magnet:?xt=urn:btih:F77F5133B209D29126812CFAC9B0FE2508DC52A9&xl=584113510&dn=%E9%9C%B8%E7%8E%8B%E5%88%AB%E5%A7%AC.rmvb',
'magnet:?xt=urn:btih:E2A87A1922139C5C44965B77F5EC21F1442C97A4&xl=1073579448&dn=#_IBW118',
'magnet:?xt=urn:btih:CC2711AE1A5CCB8CB5FB3E6F900F404BD4792517&xl=1367609104&dn=%E9%98%BF%E7%94%98%E6%AD%A3%E4%BC%A0.[1024%E5%88%86%E8%BE%A8%E7%8E%87].rmvb'
]
for i in range(20):
bdtest.download(magnets[i%5])
关于如何批量获取磁力链接地址可参阅往期系列文章:
Python实现电影排行榜自动网盘下载(4)Cookies免登录+抓包下载
Python实现电影排行榜自动网盘下载(3)Selenium离线下载
Python实现电影排行榜自动网盘下载(2)Scrapy深入 “打包员”“快递员”
Python实现电影排行榜自动网盘下载(1)Scrapy爬虫框架
网易云音乐评论抓取实验(1)接口获取