数据结构
向量
元素:数字或者字符串
标量:一个元素组成的变量
向量:多个元素组成的变量
从向量中提取元素
- 根据元素的位置
- x[4] 第四个元素
- x[-4] 除了第四个元素之外的元素
- x[2:4] 第二到第四个元素
- x[-(2:4)] 除了第二到第四个元素
- x[C(1,5)] 第一和第五个元素
- 根据值
- x[x==10] 等于10的元素
- x[x<0]
- x[x %in% c(1,2,5)] 存在于向量(1,2,5)中的元素
数据框(就是表格的意思)
- 读取本地数据
read.table(file=”peanuts.txt”, sep=”\t”,header=T)
sep函数:
csv文件 sep=”,” 表示以逗号分割
txt 文件 sep=”\t” 表示以制表符分割
其他文件sep=”” 以空格分割
Header函数:
指示文件是否将变量名作为第一行 - 设置行名和列名
Colnames(x) 查看列名
Rownames(x) 查看行名
修改行名x<- read.csv(file="peanuts.txt.",sep="", header=T,row.names=1)
row.names 修改行名 - 数据框的导出
write.table(x,file="yu.txt",sep=",",quote=F) - 变量的保存与加载(保存格式是RData)
save.image(file="bioinfo.RData") 保存当前所有变量
save(x,file="test.RData") 保存其中一个变量
load("test.RData") 再次使用 -
提取元素
x[x,y] 提取第x行ylie
x[x,] 提取x行
x[,y] 提取y列
x[y] 同上
x[a:b]第a列到第b列
x[c(a,b)] 第a列和第b列
x$列名 提取单列