RStudio清空控制台快捷键:cltr+l
R语言的数据结构主要包括:向量c(),矩阵matrix(),数组array(),数据框data.frame()、因子factor()、列表list()
一、向量:c(value),一维,通过索引遍历,索引 的起始值为1(不同于python的0)
1、向量的定义
2、向量的单个元素读取
3、向量的元素切片
4、向量的多个非连续元素读取(比较独特)
二、矩阵matrix(value,nrow,ncol,byrow,dimname):二维,包括行列
定义:
参数分别是:矩阵中将要填充的元素,nrow行数,ncol列数,dimnames行名和列名(注意dimnames中包含了可选的、以字符型向量c表示的行名和列名)
遍历:通过索引遍历
下图框框中分别对应:获取第二行,获取第3列,获取第二行第三列的元素,获取第4行的第2,4,5的元素(R中获取不连续的元素都是通过向量c)。
三、数组:array(value, dim),与矩阵类似,只不过可以不只是二维
定义:参数1为数值,参数2指定array维度(shape)
索引:
1,2、获取指定位置的单个数值
3、获取指定维度的几个不连续数值
4、获取某整个维度的值,即仅仅指定该维度,其他维度,,
四、数据框:data.frame(col1,col2,...),类似于python中的pandas.DataFrame()
定义:直接将向量作为参数,向量名就是列名
索引取值:
1、获取指定列的值
2、获取指定行或单个值:通过索引直接使用[] + ,
3、选取一个给定数据框中的某个特定变量,$,attach(),with()/within()(within允许你修改数据框)
其中,如果存在多个c_age同名变量,attach()会有局限。
其中,函数with()的局限性在于,赋值仅在此函数的括号内生效,定义外部变量需使用<<-特殊赋值符。
对frame进行修改:
1、增加新列
2、获取列名,并更改列名
五、因子:factor(vector,ordered,level),以一个整数向量的形式存储类别值,整数的取值范围是[1... k ](其中k 是名义
型变量中唯一值的个数),同时一个由字符串(原始值)组成的内部向量将映射到这些整数上。
参数:vector为一个类别(名义型)变量和有序类别向量,
level:覆盖整数映射的默认排序,默认顺序为根据字母排序
六、列表:list():以上介绍的所有数据类型都可以存在一个list中
定义:
list的索引取值:
处理对象常用的一些函数:
1、获取对象中元素数:length(object)。补充:类似于Python中的len()
2、获取对象维度:dim(object)。补充:类似于python中的object.shape
3、显示对象的内部结构:str()。注意:不同于python中将其他数据类型转化为string
4、缺失值情况:1)判断是否存在缺失值is.na(object);2)na.omit(object)可以删除所有含有缺
失数据的行;3)多数的数值函数都拥有一个na.rm=TRUE选项,可以在计算之前移除缺失值并使用剩余
值进行计算。
5、日期处理:Sys.Date():获取当时日期;date();获取当时时间和日期;format(date,format):对日期指定格式输出