Python自动化可以实现一些常见的功能,如刷短视频、赞藏评、直播间发消息弹幕、指定时间给某人发祝福信息、不同人发不同消息和采集界面上的数据等,高效的实现批量和定时操作。网红的数据有些就是通过自动化程序模拟人工方式刷的,操作越接近人工越不会被平台封禁,尽量不要用sleep(1)、sleep(3)这种整数时间的等待,一看就是机器。
程序实现思路
1、安装和配置Appium、DrissionPage、Python和相关的库
2、自动定位和操作界面元素
3、自动定位页面元素提取数据
4、循环刷新获取数据
5、数据去重排序保存到Excel或各种数据库
自动化环境安装
DrissionPage 4.0.4.8
Appium-Python-Client 2.0.0
selenium 4.0.0
注意各库之间版本兼容
效果演示
总结
内容采集需要遵守相关法律法规和网站的使用条款。
Web端采集数据已经有成熟的工具如八爪鱼等,移动端还没发现类似工具,实现起来底层原理是一样的。
以上都是些采集数据基本入门知识,对这方面感兴趣看下就会。更进一步可以研究以下技术点
拦截Ajax请求
代码注入
逆向请求参数加密算法
各种验证码自动识别
逆向App、脱壳、修改so函数