一、抓取详细的职位描述信息
详情页分析
在详情页中,比较重要的就是职位描述和工作地址这两个
由于在页面代码中岗位职责和任职要求是在一个 div 中的,所以在抓的时候就不太好分,后续需要把这个连体婴儿,分开分析。
推荐下我自己创建的Python学习交流群960410445,这是Python学习交流的地方,不管你是小白还是大牛,小编都欢迎,不定期分享干货,包括我整理的一份适合零基础学习Python的资料和入门教程。
爬虫用到的库
使用的库有:
requests
BeautifulSoup4
pymongo
Python 代码
代码 easy,初学者都能看懂。
二、数据清洗
校正发布日期
校正薪水以数字保存
根据 工作经验年限 划分招聘等级