From 生信技能树
-视频回放:R语言-向量练习和数据结构入门
-proj:R_01.Rproj
-课件:R_01.pdf
-课时长:88'28''前半部分
-主讲人:小洁忘了怎么分身
2.1 向量的生成
(1)用c()逐一放到一起(手串儿得有穿的绳儿)
(2)连续的数字用冒号”:”
(3)有重复的用rep(),有规律的序列用seq(),随机数用rnorm
rnorm(n = 3, mean = 0, sd = 1) 等同于rnorm(n = 3)
sd越大,曲线越扁
(4)通过组合,产生更为复杂的向量。
paste0把下标相同的元素连接在一起
paste和paste0的去区别:
https://www.jianshu.com/p/44e3de9b7a81
tips:数据类型转换的优先顺序
字符型 to 数值型 to逻辑型
2.2 对单个向量进行的操作
重点是函数
max(x) #最大值min(x) #最小值mean(x) #均值median(x) #中位数var(x) #方差sd(x) #标准差sum(x) #总和
> x <-c(1,3,5,1)
> length(x) #长度
[1] 4
> unique(x) #去掉重复的向量元素
[1] 1 3 5
> duplicated(x)#判断向量的元素是否发生了重复,重复根据位置来判断,即一个向量的元素第一次出现就是FALSE,第二次出现就是TRUE
[1] FALSE FALSE FALSE TRUE
> table(x) #统计重复值
x
1 3 5
2 1 1
> sort(x) #默认decreasing = FALSE,从小到大排列
[1] 1 1 3 5
2.3.对两个向量的操作
逻辑比较
x和y一样长
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x == y
[1] FALSE FALSE TRUE FALSE
x和y不一样长 ,理解循环补齐,短的循环补齐长的
> x = c(1,3,5)
> y = c(3,2,5,6)
> x == y #判断x和对应位置的y是否相等;x, y长度不相同的情况下以长的为准,和谁在前谁在后没有关系;
[1] FALSE FALSE TRUE FALSE
Warning message:
In x == y : longer object length is not a multiple of shorter object length
x和y一样长
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x %in% y #判断x的每个元素在y中是否存在,和前后有关系
[1] FALSE TRUE TRUE FALSE
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x[x %in% y] #正确格式
[1] 3 5
> y[x %in% y] #或者x[y %in% x]虽然不会报错,但是没有意义
[1] 2 5
> y[y %in% x] #正确格式
[1] 3 5
x和y不一样长,长度和x一样
> x = c(1,3,5)
> y = c(3,2,5,6)
> x[x %in% y]
[1] 3 5
数学计算
x和y一样长
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> x + y #对应下标的加减乘除
[1] 4 5 10 7
x和y不一样长
> x = c(1,3,5)
> y = c(3,2,5,6)
> x + y #不对应时,从短的循环补齐长的进行计算
[1] 4 5 10 7
Warning message:
In x + y : longer object length is not a multiple of shorter object length
连接
x和y一样长
> x = c(1,3,5,1)
> y = c(3,2,5,6)
> paste(x,y, sep = ",")
[1] "1,3" "3,2" "5,5" "1,6"
x和y不一样长
> x = c(1,3,5)
> y = c(3,2,5,6)
> paste(x,y, sep = ",")
[1] "1,3" "3,2" "5,5" "1,6"
交并补集
2.4.向量筛选(取子集)[ ]:
根据逻辑值,【这里是与x等长的逻辑值向量】将TRUE对应的向量挑选出来,FALSE丢弃
> x <-8:12
> x[x == 10]
[1] 10
> x[x < 12]
[1] 8 9 10 11
> x[x %in% c(9,13)]
[1] 9
x[!duplicated(x)] # == unique(x)
x[order(x)] # == sort(x)
根据位置,【这里是下标组成的向量】将下标组成的向量挑选出来
> x <-8:12
> x[4]
[1] 11
> x[2:4]
[1] 9 10 11
> x[c(1,5)]
[1] 8 12
> x[1,5] # 不能没有c(),否则会报错
Error in x[1, 5] : incorrect number of dimensions
> x[-4]
[1] 8 9 10 12
> x[-(2:4)]
[1] 8 12
踩坑操作
> z = rnorm(n=10,mean=0,sd=18)
> z[z< -2] # <-和< -容易踩坑
[1] -13.732056 -3.771442 -9.637322 -13.815601 -3.189252
> z[z<(-2)] #所以要加括号或者有空格
[1] -13.732056 -3.771442 -9.637322 -13.815601 -3.189252
> z[z<-2]
[1] -2.863705
> z[z<(-33)] #没有我要的<-33的数,所以返回的是一个长度为0的数值型向量
numeric(0)
2.5 如何修改向量中的某个/某些元素?即取子集和赋值的集合
多次赋值以最后一次为准
2.6 简单向量作图
boxplot什么意思?怎么看?
向量匹配排序-match(x,y):x在y中的向量下标
> x <-c("A","B","C","D","E")
> y <-c("B","D","E","A","C")
> match(y,x)
[1] 2 4 5 1 3
> x[match(y,x)] # 以y作为模板,给x调顺序;谁在外面,谁就在后面
[1] "B" "D" "E" "A" "C"
> x=letters[1:5]
> x
[1] "a" "b" "c" "d" "e"
> y=letters[c(3,1,2,5,4)]
> y
[1] "c" "a" "b" "e" "d"
> match(x,y) #x在y中的向量下标
[1] 2 3 1 5 4
> y[match(x,y)]
[1] "a" "b" "c" "d" "e"
> ## [1] "a" "b" "c" "d" "e"
> kids = c("jimmy","doodle","nicker","lucy","tony")
> scores = c(100,59,73,95,45)
> sort(scores) #将向量从小到大排列
[1] 45 59 73 95 100
> order(scores) #将向量中元素在sort后的位置标出
[1] 5 2 3 4 1
> kids[order(scores)] #按order的下标排序c
[1] "tony" "doodle" "nicker" "lucy" "jimmy"
向量的几个进阶小问题
1.两个不同类型的向量合并在一起会怎么样?
2.如何将两个向量合到一起,组成一个长向量?
3.如何在向量首/尾/中间某位置增加一个元素?
4.如果向量x和y内容一致但顺序不一致,如何按照x的顺序排列y?https://mp.weixin.qq.com/s/2eJPrT7lz562vX0ij4gfVg