1. 分组,透视,交叉
2. 分组
多层级的数据逻辑
导入英雄数据:
分组:
第一步:groupby,拿到一个对象。
通过对象的groups的属性可以拿到一个字典
第二步:将对象做一个聚合,所有能聚合的都会进行聚合
第三步:想拿到某些字段,做列访问,或者列表访问
多分组:第一步:
第二步:聚合
第三步:分组做不同的聚合
键值对的值怎么写:函数名,用字符串表示就可以了。
3.透视表 pd.pivot_table
参数说明:data:要操作的对象(表),values:要查看的值,index:要把哪一列分组作为行,columns:把哪一个作为列展示, aggfunc:聚合的函数,对观察的vlues值做什么操作。
结果:
因为远程没有刺客,所以最右上方是NaN空值。
69个英雄
透视表做不同列的聚合函数
透视表增加行方向和列方向的统计:margins = True
4.交叉表 pd.crosstab()
留意操作对象,没有data,那index=data.role_main等。不能直接用字符串。
需要给两列数据,看两列之间的关系。
方法一:
交叉表等同于数据表,统计个数:
方法二:
hero.crosstab