Python小组学习讨论记录
时间:2017.04.08 地点:文渊楼251
主讲人:臧奇颜 主讲内容:pyhton基础
clawer.py是抓取一份pdf文件的代码,clawer_1是循环抓取多份pdf文件的代码,安装好Python2.7之后,利用pycharm可直接运行代码。尝试思考每一行代码的意义,学会利用搜索引擎解决问题
* 数据类型和变量
- Numbers(数值)
- String(字符串)
- List(列表)
- Tuple(元组)
- Set(集合)
- Dictionary(字典)
* 运算符
- 算术运算符
- 关系运算符
- 赋值运算符
- 逻辑运算符
- 位运算符
- 成员运算符
- 身份运算符
* 条件和循环语句
- if...else..
- for...in range(n)...
爬虫入门
import urllib url = 'http://www.comap-math.com/mcm/2017Certs/70551.pdf' urllib.urlretrieve(url,'70551.pdf')
url_part1 = 'http://www.comap-math.com/mcm/2017Certs/' for i in range(70551,70556): url_part2 = str(i)+'.pdf' url = url_part1 + url_part2 urllib.urlretrieve(url,url_part2)
下期任务:
1.每人写一个简单的爬虫,可以抓取图片或文字或文件;
2.又或者做一份简单的前端html+css的页面布局 ;
3.下周六每人进行投影展示并提出自己在实际动手中遇到的问题
(目的:通过实际练习来了解Python基础或者前端基础)