查看或更改R包的存储路径
创建连续数值的向量
创建矩阵
is. & as.系列函数
数据导入,导出
挑选符合条件的行记录
read.table(comment.char="!")
行名rownames()
数据框的简单统计
写一个函数
左右合并两个数据框
查看或更改R包的存储路径
#查看
> .libPaths()
[1] "E:/LINUXlearning/learning/R/R-3.5/R-3.5.1/library"
#更改
.libPaths("文件夹路径")
#或
install.packages("包",lib="文件夹路径")
创建连续数值的向量
a = 1:10
b = seq(1,10)
c = seq(1,10,2)
创建矩阵
# dim()改变维度
> x <- 1:12 ; dim(x) <- c(3,4)
> x
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
is. & as.系列函数
#is.系列函数,判断变量是否为某种类型,返回布尔值
> is.matrix(x)
[1] TRUE
#as.系列函数,转换变量类型,并返回变量
> y <- as.data.frame(x)
> y
V1 V2 V3 V4 #数据框有行列名,没有设置行列名也会自动加上
1 1 4 7 10
2 2 5 8 11
3 3 6 9 12
> str(y) #查看内部结构
'data.frame': 3 obs. of 4 variables:
$ V1: int 1 2 3
$ V2: int 4 5 6
$ V3: int 7 8 9
$ V4: int 10 11 12
#与矩阵x的对比
> x
[,1] [,2] [,3] [,4]
[1,] 1 4 7 10
[2,] 2 5 8 11
[3,] 3 6 9 12
> str(x)
int [1:3, 1:4] 1 2 3 4 5 6 7 8 9 10 ...
数据导入,导出
#把RStudio编辑界面中的变量导出来
save(y,file = "y.Rdata")
#将外部数据导入
load(file = "y.Rdata")
write.csv(数据框变量,“名称.csv”)
read.csv(“名称.csv”)
还有read.xxx系列
对于数据框的某一列,如何针对该列挑选出符合条件的行记录
#以"grep"为例
index1=grep("W-type",data_f$V1) #返回索引
index2=grepL("W-type",data_f$V1) #返回布尔值
wanted=data_f[index1,]
wanted=data_f[index2,]
#还有filter函数
read.table(comment.char="!")这个参数指定注释行的开头字符
read.table("GSE17215_series_matrix.txt",comment.char = "!",sep = "\t",header = T,row.names=1)
指定某一列为行名后,删除该列
rownames(数据框变量)=数据框变量[,1]
数据框变量=数据框变量[,-1]
数据框的简单统计
max(b$GSM431121)
min(b$GSM431121)
fivenum(b$GSM431121) #最大、最小及四分位数
table(b$GSM431121 > 10000) #统计>10000和<=10000各有多少
> mean(a[1,])
[1] NA
Warning message:
In mean.default(a[1, ]) : 参数不是数值也不是逻辑值:回覆NA
> mean(as.numeric(a[1,]))
[1] 1955.593
#原因如下,数据框不能直接求均值
> str(a[1,])
'data.frame': 1 obs. of 6 variables:
$ GSM431121: num 482
$ GSM431122: num 597
$ GSM431123: num 2722
$ GSM431124: num 2566
$ GSM431125: num 2738
$ GSM431126: num 2629
> str(as.numeric(a[1,]))
num [1:6] 482 597 2722 2566 2738 ...
#求行均值
##简单方法
rowMeans(a)
##for循环
for (i in 1:nrow(a)) {
print(mean(as.numeric(a[i,])))
}
##第三种,x表示as.numeric(a[i,])
apply(a,1,function(x){
mean(x)
})
##第四种
apply(a,1,mean)
#同理,求最大值
for (i in 1:nrow(a)) {
print(max(as.numeric(a[i,])))
}
##
apply(a,1,function(x){
max(x)
})
##
apply(a,1,max)
写一个函数
hsy <- function(x){
for (i in 1:nrow(x)) {
a=as.numeric(x[i,])
b=a[1]+a[2]
print(b)
}
}
hsy(a)
左右合并两个数据框
cbind(a1,a2)
这一部分的学习内容来源于生信技能树,在此表示感谢!!!