爬虫课程（一）｜课程介绍和安排

一

人工智能时代的来临，随着互联网数据越来越开放，越来越丰富。基于大数据来做的事也越来越多。数据分析服务、互联网金融、数据建模、医疗病例分析、自然语言处理、信息聚类，这些都是大数据的应用场景，而大数据的来源都是利用网络爬虫来实现。

爬虫采集大数据的应用场景

二

Google、百度，以及新起之秀今日头条的数据也是利用爬虫采集而来，甚至可以说目前的互联网资讯企业爬虫工程师的地位越来越高。随着大数据的来临，数据爬取的需求越来越大，应用也越来越广泛，爬虫工程师的薪资也变得越来越高。同时因为python在网络爬虫方面的优势，python语言的使用热度也越来越高。

编程语言流行指数

三

经过我和我公司HR近几个月的招聘情况来看，现在互联网企业市场上爬虫应用虽然是越来越广泛，但相应的人才却非常少。上次我在爬虫｜利用Python Scrapy进行爬虫开发指南清单文章中约定我要编写一套python爬虫课程，也是基于爬虫开发这块的人才太少的前提下的决心。

我的计划是前期先以文字稿的形式在简书上编写，后期看喜欢的人数情况再录制课程视频，视频上会边敲代码边讲解。

四

大致的课程安排如下。

第一讲：爬虫环境配置和基础知识介绍，这一讲涉及到的主要知识点如下。

1）PyCharm的安装和使用

2）基本的正则表达式编写

3）爬取整个网站时的深度优先和广度优先遍历算法的讲解

第二讲：利用python scrapy框架爬取三个知名网站（知乎、微博、豆瓣）的数据案例讲解，知识点如下。

1）学会使用path和css选择器提取网站html中我们需要的元素

2）在讲解这三个案例的过程中会讲解到scrapy框架中spider、item、item loader、pipeline、CrawlSpider的使用

第三讲：如何突破各大网站的反爬技术。

1）随机更换user-agent

2）设置ip代理池

3）突破图片验证码，文字验证码

4）将selenium和phantoms集成到scrape中获取动态网页的数据

5）自动化模拟输入点击操作（比如模拟人工输入用户名、密码，点击登录等一系列操作）

第四讲：scrape 进阶开发，刨根问底（核心组建源码分析）

1）基于scrapy源码分析，深入理解scrapy的执行原理

2）middleware详解，基于中间件开发

3）信号（Signals）详解

4）email发送

第五讲：scrape高级开发（看时间情况确定讲的细度）

1）如何搭建一套scrape 分布式爬虫系统

2）如何搭建一套适合企业需要的爬虫web系统（服务器管理、任务管理、异常监控和管理），这块我在会结合我们企业的真实案例来讲解，架构｜如何设计一款类“即刻”信息订阅推送的爬虫架构。

第六讲：课程总结和源码共享

1）课程总结和回顾

2）部分有价值的源码开放，微信公众号文章、微博、知乎、今日头条、简书、豆瓣等

人生苦短，我用python。

你的点赞是我坚持的源泉，谢谢。

最后编辑于：2017.12.11 05:00:24

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,378评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,356评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,702评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,259评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,263评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,036评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,349评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,979评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,469评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,938评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,059评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,703评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,257评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,262评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,485评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,501评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,792评论 2赞 345

爬虫课程（一）｜课程介绍和安排

推荐阅读更多精彩内容