读取Excel表的时候,经常会遇到一些说明性的文字(如图),当直接用pd.read_excel
读取表格时,会将说明文字也会读取进来,对应的DataFrame会存在Unnamed
这样的列。
可通过如下方式来去除Unnamed
列
>>> import pandas as pd
>>> data = pd.read_excel('a.xlsx')
a b c Unnamed: 3 Unnamed: 4
0 1 2 3 NaN 说明:
1 2 3 4 NaN NaN
2 3 4 5 NaN NaN
3 4 5 6 NaN NaN
>>> new_data = data.loc[:, ~data.columns.str.contains("^Unnamed")]
a b c
0 1 2 3
1 2 3 4
2 3 4 5
3 4 5 6