1从文件中获取
我们通常会从文件中导入数据,文件类型可以是文本文件,也可以使excel表格。我个人认为,最 常 用、最 好 用 的 是.csv 文 件。.csv叫做逗号分隔文件,什么是逗号分隔?:
比如 :test.csv
年龄 , 身高 ,工资
20 ,178 ,2000
40 ,158 ,200000
这个就是逗号分隔。你可以在excel里,另存为.csv文件。那有了.csv文件,怎么导入呢?可以使用read.table()函数。
test<-read.table("test.csv",header=TRUE,seq=",")
其中,第一个是文件位置,第二个为true的化,它会把首行导进来,就是
年龄 , 身高 ,工资,分隔符号就是','号。 这个文件的内容就会被导入到,test数据框中。另外需要注意的是,工作空间,当文件在当前工作空间时,可以这样写,不再工作空间,文件位置可以写绝对地址。另外可以使用
getwd()
setwd()
获取当前目录,或者设置当前目录。
2从数据库中导入
这个有两种方法:基于RODBC,利用各个数据库所对应的ODBC数据来导入相应数据库下面的表里面的信息。;基于R语言对于每个数据库所提供的接口来获取表里面的信息,例如与MySQL数据库对应的RMySQL包。
这里使用第二种
> #1 加载RMySQL包
> library(RMySQL)
> #2 建立连接
> con <-dbConnect(MySQL(), user="root", password = "root", host = "localhost", dbname="student")
> #3 导入名为score表的信息
> mydataframe <-dbReadTable(conn = con, name = "score")