个人想法:
翻译文件源自Scrapy Documentation(Release 1.4.0)
而我暂时选定了其中的FirstSteps中的Scrapy Tutorial来翻译,因为平时我们阅读和实战都从这一章开始。
为什么要去翻译官文?
督促自己将官文看完,提升自己英语水平,还有个人认为官文在学习方面更可靠,如果是在实战方面的话技术博客更好一点。还有其他什么乱七八糟的都有。
前言:
在此教程中,我们假定Scrapy已经安装在你们的系统中。如果还没有安装的话,请查看安装教程。
我们将会爬取quotes.toscrape.com网站,这个网站罗列了一些著名作者的语录。
此教程将带领大家完成如下任务:
1.创建一个Scrapy项目
2.写一个爬虫爬取一个网站与提取网站的相关数据
3.以命令行的方式输出爬取的数据
4.修改爬虫去递归(循环)爬取网站的其他链接
5.使用爬虫命令行参数
Scrapy爬虫框架是使用Python语言编写的。如果你是第一次接触计算机编程语言,你可能想要先了解一下Python语言是一门怎样的计算机语言,以便你更好的使用Scrapy爬虫框架。
如果你早已熟悉其他的计算机语言,并希望更有效率学习Python语言,我们建议你通读Dive Into Python 3。或者,你也可以阅读Python Tutorial。
如果你是编程新手,并想从Python着手学习,你可能需要寻求一本有意义的在线电子书Learn Python The Hard Way,你也可以看一下This List Of Python Resources For Non-Programmers