先上思维导图数据类型
向量(vector):重要
矩阵(Matrix)
数组(Array)
数据框(Data frame):重要
List
一、向量
-
1.标量和向量的区分
元素:可为数字或字符串
数字:1,2,3
字符串:s=“abcdefghij”,则s[1]=“a”,s[10]="j"
标量:一个元素组成的变量
向量:多个元素组成的变量
赋值:赋予这个变量一个数值(其实也不一定是数值,还可以是字符串/数据框等等)
-
2.从向量中提取元素
(1)根据元素位置
(2)根据值的大小的
-
根据元素位置
下图应该说是元素,也有可能不是单纯的数值
-
根据数值大小
a[a %in% c(1,2,3)] :存在于向量c(1,2,5)中的元素
二、数据框
1、读取本地数据
**read.table(file = "huahua.txt",sep = "\t",header =T) **:读取文件,分隔符为Tab,有表头
a<-read.table(file = "huahua.txt",sep = "\t",header =T) :把这个数据框赋给一个变量a
结果是因为这个软件每次开启时要重置工作目录
终于好了,还是出错了
把数据框赋给变量a
2、设置行名和列名
- 打开本地目录
- colnames(X) :查看列名
- rownames(X) :查看行名,默认值的行名就是行号,1.2.3.4...
- colnames(X)[1]<-"bioplanet":有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
- X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1):最后row.names的意思是修改第一列为行名
3、数据框的导出
4、变量的保存与重新加载
这次没有处理完的数据下次想接着用怎么办?
学会保存和重新加载。保存的格式是RData。
- save.image(file="bioinfoplanet.RData"):保存当前所有变量
- save(frame1,file="frame1.RData"):保存其中一个变量
- load("frame1.RData"):再次使用RData时的加载命令
保存其中一个变量
再次使用RData时的加载命令
5、提取元素
6、直接使用数据框中的变量
提取某两列作散点图:
其中case和value为某列的名称