- 列表项爬虫启动,引擎(Engine)会将起始的url传入到调度器(Scheduler)
- 列表项调度器(Scheduler)将url发给下载器(Download),下载器(Download)发起网络请求并将得到的数据发给爬虫(Spider)进行分析
- 列表项爬虫(Spider)开始分析数据,得到数据之后有两种情况:
- 分析得到下一个链接,进一步调用调度器(Scheduler)对链接进行前面两步操作
- 将分析得到的需要保存的数据,它们则被送到项目管道(Item Pipeline)那里,那是对数据进行后期处理(详细分析、过滤、存储等)的地方