什么是爬虫?
就是抓取网页数据的程序
爬虫怎么抓取网页数据?
网页三大特征:
网页都有自己唯一的URL。
网页都是HTML来描述页面信息。
网页都使用http/https协议来传输HTML数据。
爬虫的设计思路:
获取视频ID
拼接完整url
获取视频播放地址
下载视频
模块使用 requests
安装“pip install requests”
推荐下我自己创建的Python学习交流群960410445,这是Python学习交流的地方,不管你是小白还是大牛,小编都欢迎,不定期分享干货,包括我整理的一份适合零基础学习Python的资料和入门教程。
Requests库的七个主要方法
找到单个视频播放地址
获取网页源代码
获取播放地址
下载视频