python下处理:
一:导入对应预处理包:通过import命令
1.numpy:跟矩阵计算相关的包;
2.pandas:预处理数据包
3.matplotlib.pyplot:可视化相关的包
二:引进数据包,准备好数据
1.datasets = pandas.read_csv('Data.csv')
2.遗失数据 a.取最大值,最小值,中间值,b.平均数 c.删除它
处理遗失数据需要导入包 from sklearn.preprocessing import Imputer
R语言下处理:
1.找到对应的文件数据路径
2.datasets = read_csv('Data.csv')