2.1 数据集的概念:数据集通常是由数据构成的一个矩形数组,行表示观测,列表示变量
2.2 数据结构 R拥有的对象类型包括标量,向量,矩阵,数组。数据框和列表
向量:存储数值型,字符型或逻辑型数据的一维数组,通过在方括号中给定元素所处位置的数值,可以访问想两种的元素:
矩阵:二维数组
数组
数据框:不同的列可包含不同的模式(数值型、字符型)等;通过data.frame()创建
mydat<-data.frame(c1,c2……)
选取数据框中的元素方法:mydat[1:2] mydat[c("",""),] mydat[,c(1:3)] mydat$qq
因子,变量可分为名义型、有序性或连续型变量。
名义型变量是没有顺序之分的类别变量。
有序型变量表示一种顺序关系,而非数量关系。
连续型变量可以呈现为某个范围内的任何职,并同时表示了顺序和数量
名义型变量和有序类别变量在R中成为因子,函数factor()以一个整数向量的形式存储类别值