个人学习笔记,方便自己查阅,仅供参考,欢迎交流
解析库-Beautiful Soup
解析工具 Beautiful Soup,它借助网页的结构和属性等特性来解析网页。有了它 ,我们不用去写一些复杂的正则表达式,只需要简单的几条语句,就可以完成网页中某个元素的提取。
1.概述
Beautiful Soup 是Python的一个HTML或XML的解析库,可以用它来方便地从网页中提取数据。
页中提取数据
2.解析器
3.基本用法
4.节点选择器
- 选择元素
- 提取信息
- 嵌套选择
- 关联选择
5.方法选择器
- find_all()
- find()
7.CSS选择器
- 嵌套选择
- 获取属性
- 获取文本