背景
在学习了Python的基本语法后,我们急需找个项目练练手。首先,我们自然地想到了爬虫。宏观地看,爬虫主要是为了将我们想要的信息下载下来。那么,我们首先学习一下如何把网页完整地下下来。
Urllib2库
Urlib2库使我们能够十分简便地发送请求。
举个例子:
import urllib2
response = urllib2.urlopen("http://www.baidu.com")
print response.read()
三行代码,我们就可以将百度首页的代码打印出来。
同时,Urllib2也提供了各种构建请求的姿势。