R数据结构
向量
1、向量和标量的区别
- 标量指一个元素的变量,如一个字符串,一个数字等
-
向量指多个元素组成的变量,如
c("1","2")
,c("one","two")
2、从向量中提取元素
- 根据元素的位置使用[],在向量中提取元素。
x[2] #x第2个元素
x[-2]#排除法,除了第2个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
- 根据值,布尔索引
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
数据框(dataframe)
相当于一个excel表格
- 读取文本文件、xlsx等文件得到数据框
read.table()
,read.delim()
等
可以在函数中指定分隔符、header,行名等细节。 - 设置行名和列名
colnames()
:查看列名
rownames()
:查看行名
colname()[2]
:修改第二列的名字 - 导出数据框
write.table(x,file = "文件名", sep="指定分隔符")
- 变量的保存与重新加载
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令
提取元素
[行,列]
[1:3,2:4]
:取一到三行,二到四列
[c()]
在向量中指定需要的列
X$列名
直接使用数据框中变量
attach
相当于绑定一个数据框,之后便可以直接使用数据框中的列名作为变量,使用完之后使用detach
进行解绑