清洗数据工的自我修养:)
0.增加索引
df.set_index('Team', inplace=False, drop=True)
#以Team为索引
#inplace=True 在原数据集上修改
#默认情况下,设置成索引的列会从DataFrame中移除,drop=False将其保留下来
1.丢弃值
df.drop(['a','b'], axis=1) # 按列(axis=1),丢弃指定的列,默认按行
2.拼接数据
pd.merge(new_A, new_B, how='left', on='Team')
#how:指的是合并(连接)的方式有inner(内连接),left(左外连接),right(右外连接),outer(全外连接);默认为inner
#on : 指的是用于连接的列索引名称。必须存在右右两个DataFrame对象中,如果没有指定且其他参数也未指定则以两个DataFrame的列名交集做为连接键