1.read_table()/read_csv()
读取数据,并整理成DataFrame类型的表格
import pandas as pd
unames = ['user_id','gender','age','occupation','zip']
users = pd.read_table('users.dat',sep='::',header=None,names=unames)
sep字段:指定分割符
names字段:指定表格的表头
其中users.dat (UserID::Gender::Age::Occupation::Zip-code)
还有其他很多参数,可供灵活运用
另外有Series.from_csv()方法读取文件
2.写数据 to_csv()
3.csv.reader()
4.JSON数据
import json
result=json.loads(obj) #将JSON字符串转换成python对象
asjson=json.dumps(result)#将python对象(serializable)转换成JSON格式
5.使用HDF5格式
前提:安装PyTables和h5py
报错原因是上次代码创建了mymy.h5
6.读取Excel文件
前提安装:xlrd包和openpyxl包(pip install)
7.使用数据库
参见:http://blog.csdn.net/uvyoaa/article/details/74421911