Avatar notebook default
11篇文章 · 8480字 · 6人关注
  • requests 如何自动识别编码

    起因,爬虫群有人询问 requests 抓取结果打印是乱码怎么解决,于是有其他人指点按照官方的文档,用r.encoding查看默认的解码方式,然...

  • Python 实战:week3 如何让数据说话

    作业 爬取了赶集的二手商品数据,为了更好地了解二手市场行情,可以利用这些数据做哪些分析? 问题 各个类目的二手商品数量,是相对集中在几个区域,还...

  • Python 实战:week2 实战作业

    结果: 作业项目地址 总结 如何判断是否是最后一页 两种实现思路 1,是否有分页符 如果没有,pass 2,是否元素数量足够 如果没有,同样 p...

  • Python 实战:week2 设计断点续传程序

    作业代码: 作业项目地址 小结 thread & process 单进程单线程,一张一个人的桌子单进程多线程,一张多个人的桌子多进程单线程,多张...

  • Python 实战:week2 爬取手机号

    作业效果: 作业项目地址 笔记&小结 为大规模爬取做工作流的准备 观察页面结构特征 之前仅仅对特定页面做了信息抓取 但如果是对网站进行大规模抓取...

  • Python 实战:week2 在 MongoDB 中筛选房源

    作业效果: 价格大于等于500的房源 作业项目地址 小结 需要安装 pymongo,是 python 中的 mongodb 客户端。用于连接 p...

  • Python 实战:week1 实战作业

    运行结果: 代码: 项目代码 小结 获取内容 body 和 head 不一定要从 HTML 的 body 中获取,有些信息在 head 的 ti...

  • Python 实战:week1 爬取租房信息

    作业代码: 项目地址 保存爬取结果的文件 总结 BeautifulSoup 的使用 学习了一下 BeautifulSoup 的用法,并做了笔记 ...

  • BeautifulSoup 网页解析

    是什么 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的 Python 库.它能够通过你喜欢的解析器实现文档导航,查找...

文集作者