欲善其事,必先利其器
这其器必是python的标准库+内置函数,话说许多第三方库, 也是对标准库的使用,进行封装,使得使用起来更方便。
这些库以使用场景来分类:
一. 文件读写
二. 网络抓取和解析
三. 数据连接
四. 数清洗转换
五. 数据计算和统计分析
六. 图像和视频处理
七. 音频处理
八. 数据挖掘/机器学习/深度学习
九. 数据可视化
十. 交互学习
十一. 集成开发
4、数据清洗转
数据清洗转换主用于数据正式应用之前的预处理工作。
# 4.1 frozenset([iterable])
# 类型:Python内置函数
# 描述:返回一个新的frozenset对象,可选择从iterable取得的元素
# 4.2 int(x)
# 类型:Python内置函数
# 描述:返回x的整数部分
# 4.3 isinstance(object, classinfo)
# 类型:Python内置函数
# 描述:返回object是否是指定的classinfo实例信息
# 4.4 len(s)
# 类型:Python内置函数
# 描述:返回对象的长度或项目数量
# 4.4 long(x)
# 类型:Python内置函数
# 描述:返回由字符串或数字x构造的长整型对象
# 4.5 max(iterable[, key])
# 类型:Python内置函数
# 描述:返回一个可迭代或最大的两个或多个参数中的最大项
# 4.6 min(iterable[, key])
# 类型:Python内置函数
# 描述:返回一个可迭代或最大的两个或多个参数中的最小项
# 4.7 range(start, stop[, step])
# 类型:Python内置函数
# 描述:用于与for循环一起创建循环列表,通过指定start(开始)、stop(结束)和step(步长)控制迭代次数并获取循环值
# 4.8 raw_input(prompt)
# 类型:Python内置函数
# 描述:捕获用户输入并作为字符串返回(不推荐使用input作为用户输入的捕获函数)
# 4.9 round(number[, ndigits])
# 类型:Python内置函数
# 描述:返回number小数点后ndigits位的四舍五入的浮点数
# 4.10 set([iterable])
# 类型:Python内置函数
# 描述:返回一个新的集合对象,可选择从iterable获取的元素
#4.11 slice(start, stop[, step])
# 类型:Python内置函数
# 描述:返回表示由范围(start、stop、step)指定的索引集的切片对象
# 4.12 sorted(iterable[, cmp[, key[, reverse]]])
# 类型:Python内置函数
# 描述:从iterable的项中返回一个新的排序列表
# 4.13 xrange(start, stop[, step])
# 类型:Python内置函数
# 描述:此函数与range()非常相似,但返回一个xrange对象而不是列表
# 4.14 string
# 类型:Python标准库
# 描述:字符串处理库,可实现字符串查找、分割、组合、替换、去重、大小写转换及其他格式化处理
# 4.15 re
# 类型:Python标准库
# 描述:正则表达式模块,在文本和字符串处理中经常使用
# 4.16 random
# 类型:Python标准库
# 描述:该模块为各种分布实现伪随机数生成器,支持数据均匀分布、正态(高斯)分布、对数正态分布、负指数分布、伽马和β分布等
# 4.17 os
# 类型:Python标准库
# 描述:用于新建、删除、权限修改、切换路径等目录操作,以及调用执行系统命令
# 4.18 os.path
# 类型:Python标准库
# 描述:针对目录的遍历、组合、分割、判断等操作,常用于数据文件的判断、查找、合并
# 4.19 prettytableabs
# 类型:Python标准库
# 描述:格式化表格输出模块
# 4.20 json
# 类型:Python标准库
# 描述:Python对象与json对象的转换
# 4.21 base64
# 类型:Python标准库
# 描述:将任意二进制字符串编码和解码为文本字符串的Base16,Base32和Base64