1.使用series.unique() 发现其长度为18
而使用describe()中的count 或者dingdan_df['driver_phone'].value_counts()时为17个value,原因是后两者仅统计非空的值。
查找:
unique()得到的为一个ndarray,从而无法直接用list中的if np.nan in test1:来判断。
list求并交差:
http://blog.chinaunix.net/uid-200142-id-3992553.html
2.dictionary转DataFrame
dict.items()为一个dict_items类型的对象,需要转为list再传入,同时指定列名
gongdan_users=pd.DataFrame(list(gongdan_dic.items()),columns=['driver_phone','counts'])