【负基础学习python】01python基础

欢迎来到负基础python课堂的第二课

区别于其他教程的一点是，本课程采用的方式是实战中学习。不会一开始就堆砌所有的python语法，让大家在动手写程序的同时学习相关的python语法，这样才是最快的学习方法。

python基础语法

虽然不会堆砌所有的python语法，但是，最基础的语法，我们还是要搞定的。

首先，大家来看下面的代码：

# -*- coding: UTF-8 -*-
# 从urllib库中导入request库文件
from urllib import request

if __name__ == "__main__":
    response = request.urlopen("http://www.baidu.com")
    html = response.read()
    print(html)

这是一个最简单的爬虫（稍后会解释）程序。

代码详解

第一行

# -*- coding: UTF-8 -*-

表示的是本文件的python采用的是UTF-8的编码方式。

大家知道如果程序中有中文就要加上这一句话就行了，如果要细究的话，一个星期都说不完。

第二行

# 从urllib库中导入request库文件

表示的是注释，简单点说就是让人看懂懂就不会执行这句语句了，所以#符号之后的东西都是不会运行的。
PS：这个注释符号只能注释一句话。
需要多行注释可以用多个 # 号，还有 ''' 和 """(该编辑器只可采用#)：

# 这是第一句注释
# 这是第二句注释
"""
这是第一句注释
这是第二句注释
这是第三句注释
"""

以下都是注释:

# 这是一个注释，不会被执行
# 这是第一句注释
# 这是第二句注释
# 这是第三句注释
"""
我也是注释，但是在这里我会被执行
"""
'''
我和楼上老铁一样，我在这里也会被执行
'''

第三行

from urllib import request

表示从urllib库中导入request库文件（至于文件是干嘛的，下文中会介绍，大家不要着急）

你可能会问，为什么要导入其他的文件呢？

A：因为python的源程序中是只能做有限的功能的，我们需要其他的库来进行扩充。只要有官方或者其他的人来设计这个库，理论上来说，python能做到绝大多数的事情。

更详细的教程参见:查看廖雪峰博客[https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014318447437605e90206e261744c08630a836851f5183000]

第四行

if __name__ == "__main__":

这个大家现在可以简单的理解为“主函数”，也就是程序的入口，在这个函数里面（缩进）的代码都将按照顺序执行。

具体的内容参见：http://blog.konghy.cn/2017/04/24/python-entry-program/

第五行

response = request.urlopen("http://www.baidu.com")
html = response.read()

我们可以把上面的两句语句简化：

# 1.表示将a的值赋值给b，此时b拥有a的值
b = a
# 2.对b进行变化赋给c，此时c拥有b_的值
c = b_ # 其中_表示对b进行变换（采用某种方法）

现在，我们在回到之前的语句中：

response = request.urlopen("http://www.baidu.com")
html = response.read()

按照之前的推广，解释如下:

1.将request.urlopen("http://www.baidu.com")的值赋给response

2.对response进行变换（read方法）得到一个中间量，并赋值给html

PS：
1.等号左边为变量，可"随便"取名字，如：A，a，boss等。最好与作用对上号。

2..urlopen()/.read()后续会进行介绍

第六行

print(html)

第一节课就接触了这个东西，print()是python的输出语句，在python3中被封装为了函数，相当于调用print()函数，括号内的内容为需要输出的内容。

print(1+2)
print("helloworld")
a = 2
b = 3
print(a+b)

输出：

3
helloworld
5

最最最最最最最基础的python语法就简单的过了一遍，给大家选好了两个非常棒的学习python语法的网站，大家有不懂的或者要更详细的自学的可以打开网站好好学习：

1.菜鸟教程：http://www.runoob.com/python3/python3-tutorial.html

2.廖雪峰python教程：https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000

我们当然要在动手中学python啦！

接下来将进入python中最好玩，也是大家学习python的理由的部分

——爬虫

很多人学爬虫就是为了爬虫，觉得爬虫很酷。确实，特别对于学python来说，从爬虫学起是一个非常好的学习python的路线。

那么，问题来了什么是爬虫？

1.URL

爬虫，全称网络爬虫，也叫做网络蜘蛛（Web Spider），顾名思义，爬虫就是在网络上爬的“蜘蛛”，但是，爬虫不光是攀爬，还要爬取，爬取的内容就是你所需要的东西，也就是网页的内容。网络爬虫根据网页的地址寻找需要爬取的网页，这个地址也就是URL，举个例子：http://www.baidu.com/ 就是一个URL，我们可以指定爬虫去爬取某一个URL页面下的某些或者全部内容。

大家还记得开头的那个程序吗？

# -*- coding: UTF-8 -*-
# 从urllib库中导入request库文件
from urllib import request

if __name__ == "__main__":
    response = request.urlopen("http://www.baidu.com")
    html = response.read()
    print(html)

这段程序中urllib这个库就是用来处理URL的，所以我们才会导入（从）这个模块（导入相应的包（库文件））

2.urllib

urllib是一个处理URL的库（官方称为package（包），我更喜欢称为库）。内置很多模块，可以非常方便的处理URL相关的信息。

其中，就包括request库文件（模块）。这就回到我们之前的那个代码中，为什么

from urllib import request

就是为了从urllib中导入requests模块，进而更好的处理URL。

3.urlopen()&read()

urlopen是urllib库中的requests模块的一个函数（功能），使用这个函数就可以很轻松的打开一个URL网页（网站），读取里面的内容。

request使用使用.urlopen()打开和读取URLs信息，返回的对象response如同一个文本对象，我们可以调用read()，进行读取。再通过print()，将读到的信息打印出来。

PS:

request.urlopen()
response.read()

其中的.urlopen(),.read(),可以理解为“使用XX方法”。如：.urlopen()-使用urlopen方法；.read()-使用read方法。

我们来完整的运行一遍程序：

# -*- coding: UTF-8 -*-
# 从urllib库中导入request库文件
from urllib import request

if __name__ == "__main__":
    response = request.urlopen("http://www.baidu.com")
    html = response.read()
    print(html)

打印（输出）的内容就是www.baidu.com 这个URL所指的网页（百度）的内容。
我们可以看到内容中有很多的\n\r\xe7之类的符号，那是因为编码的问题（以后会涉及，现在先不说，不影响现在学习。）
我们只需要在

html = response.read() # 后加上.decode()

html = response.read().decode()

也可以

html = response.read()
html = html.decode()

表示将read后的内容（打印出来的内容）进行解码（使用decode方法，用"utf-8"解码）（以后会涉及，现在先不说，不影响现在学习。）

现在再看看打印的结果:

# -*- coding: UTF-8 -*-
# 从urllib库中导入request库文件
from urllib import request

if __name__ == "__main__":
    response = request.urlopen("http://www.baidu.com")
    html = response.read().decode("utf-8")
    print(html)

第一个爬虫程序就完成了！

之后，我们还会用爬虫爬取图片，电影排行，房屋租售信息，股票信息，并且对爬取的内容进行数据分析，想想就很酷了~

最后编辑于：2018.03.05 21:45:28

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 202,802评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,109评论 2赞 379
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 149,683评论 0赞 335
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,458评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,452评论 5赞 364
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,505评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,901评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,550评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,763评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,556评论 2赞 319
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,629评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,330评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,898评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,897评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,140评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,807评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,339评论 2赞 342