pandas(三)
一、pandas对齐运算
1.1 Series运算
共同索引对应为运算,其它填充NaN
共同索引对应为运算,其它填充NaN
-
Series使用算术方法,不支持指定填充值
1.2 DataFrame运算
1.2.1 DataFrame算术
- 实际上,通过 + - * / // ** 等符号可以直接对DataFrame与DataFrame之间或者DataFrame以及Series之间进行运算。但秉承的原则就是对应索引运算,存在索引不同时,返回结果为索引对的并集。
- 但是实际操作会发现,当存在索引不同时,返回的值自动填充NaN。
1.2.2 使用填充值的算术方法
当存在索引不同时,返回的值自动填充NaN
指定填充
注意方向
1.2.3 混合运算
不考虑方向时
建议使用方法运算
二、Pandas统计计算和描述
2.1 Pandas统计计算和描述常用方法
2.2 Pandas统计计算和描述常用方法详解
2.2.1 sum求和
- 自动忽略缺失值
-
使用参数axis=改变求和方向
2.2.2 idxmin,idxmax最小值,最大值的标签索引
2.2.3 diff 计算第一个算术差值(时间序列)
-
个人理解,其实是当行减去上一行的结果
2.2.4 cumsum 累计值
2.3 查看汇总统计 df.describe()
2.4 表的信息df.info()
2.5 函数应用于映射
-
df.apply(func, axis=0) # 通过 apply 将函数运用到列 或者 行
-
df.applymap(func) # applymap将函数应用到每个数据上