Pandas包是我使用最频繁的几个python包之一, 功能强大, 虽然由于项目的原因, 可能会使用R里面的tidyverse来实现同样的功能, 但pandas包也不能忽略.
同学习numpy一样, 学习pandas包的几个技巧无非也就是, 如何创建, 如何索引, 如何切片, 如何针对行和列进行操作, 当然由于Dataframe这个格式的存在, 数据的聚合, 新增列, 删除列, 删除重复等等操作也不可忽略. 并且当Python包和其它可视化包联用的时候, 功能也会变得无比强大, 也就是我们常说的一行代码出图.
太简单的使用方法也就不说了, 下面笔记中涉及到的一些函数, 要么真的真的用的很频繁, 要么用的不多,但是比较有用.
import pandas as pd
#Series部分
pd.Series.value_count()
pd.Series.describe()
pd.Series.mean()
pd.Series.sort_values(ascending=False)
pd.Series.map()
#DataFrame部分
df.groupby("val")
df.get_group("group_val")
未完待续...