本章主要介绍如果再pycharm上配置运行scrapy,这样可以在pycharm打断点调试,方便抓取数据
1. 编写main.py文件
import os
import sys
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
scrapy.cmdline.execute(["scrapy", "crawl", "zhihu"])
- ‘zhihu’ 换成你爬虫的名字,这里以知乎的爬虫为例
- mian.py 文件需要放在与scrapy.cfg文件同级的目录
2. 设置pycharm
Run -> Edit Configuration -> + -> python
总结: 好了!这样设置后就能在pycharm运行scrapy了!