Part1. Review昨天通过视频学习的知识点:包括重复值处理,空值填充,空格处理,字段拆分等
Part2. 视频学习
Lesson 16 记录抽取
类似excel的过滤功能
常用条件类型
比较运算:> < >= <= !=
范围运算: between(left, right) >= left && <= right
空值匹配: pandas.isnull()
字符匹配: str.contains(pattern, na=False) na表示空值是否匹配,一般空值不进行匹配,也就设置成false
逻辑运算:& | not 条件需要用()括起来
Lesson 17 随机抽样
随机从数据中,按照一定的行数或比例抽取数据
DataFrame.sample(n, frac, replace)
n: 按个数抽样
frac:按百分比抽样
replace:是否可放回抽样,默认是不可放回
返回抽样结果数据框
n和frac两个参数二选一设置,不能两个参数都设置!