这里是一份持续更新的常用参数使用文档
inplace, axis...
import pandas as pd
import tushare as ts
inplace
简单易懂的参数,表示初始的数据是否发生变化。当我们对数据进行再加工,可以先inplace=False来观察生成的效果,得到理想中的数据之后再inplace=True
movies = ts.month_boxoffice()
movies.head()
假设我们希望电影按照口碑来进行排序
movies.sort_values('WomIndex', ascending=False).head()
movies.head()
可以看出movie是没有发生变化的,因为sort_values中的inplace默认参数是False,下面用inplace=True来改变movie数据本身。
(shift + tab juypter 操作)
movies.sort_values('WomIndex', ascending=False, inplace=True)
movies.head()
axis
axis轴线,其实表示的是你希望对数据操作的方向。axis=0,表示水平方向(rows)。axis=1,表示垂直方向(columns)。
比如上例中axis=0,就表示我们按照每个row的womIndex来进行排序。这个时候使用axis=1,会直接报错。
还是使用movies,来看一下axis=1的效果。
movies.avgboxoffice = movies.avgboxoffice.astype(float)
movies.avgshowcount = movies.avgshowcount.astype(float)
movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=0)
avgboxoffice 364.0
avgshowcount 219.0
dtype: float64
movies.loc[:, ['avgboxoffice', 'avgshowcount']].sum(axis=1)
6 48.0
0 75.0
7 50.0
8 46.0
2 52.0
3 54.0
4 53.0
1 59.0
5 52.0
9 49.0
10 45.0
dtype: float64
当axis=0的时候,计算列avgboxoffice,avgshowcount每行的加总
当axis=1的时候,计算每行avgboxoffice,avgshowcount列的加总