学习R包
R包就是多个函数的集合,利用RStudio可以实现其各种功能,按需选择。
R包的安装和加载
#镜像设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
#安装需要的R包(下面指令两个二选一,根据要安装的R包来自于CRAN网站还是Biocductor)
install.package("")
BiocManger::install("")
#加载(以下两个命令均可)
library()
require()
dplyr的基本函数
示例数据:
test <- iris[c(1:2,51:52,101:102),]
-
mutate()
,新增列
-
select()
按列筛选
-
filter()
筛选行
-
arrange()
按照某一列或者某几列对整个表格进行排序
-
summarise()
汇总
dplyr的两个技能
-
管道操作%>%(ctrl+shift+M)
-
count()
统计某列的unique值
dplyr处理关系数据
- 内连
inner_join()
取交集
inner_join(test1, test2, by = "x")
## x z y
## 1 b A 2
## 2 e B 5
## 3 f C 6
- 全连
full_join()
full_join( test1, test2, by = 'x')
## x z y
## 1 b A 2
## 2 e B 5
## 3 f C 6
## 4 x D NA
## 5 a
## 6 c
## 7 d
- 左连
left_join()
left_join(test1, test2, by = 'x')#以test1作为参照物
## x z y
## 1 b A 2
## 2 e B 5
## 3 f C 6
## 4 x D NA
left_join(test2, test1, by = 'x')#以test2为参照物
## x y z
## 1 a 1
## 2 b 2 A
## 3 c 3
## 4 d 4
## 5 e 5 B
## 6 f 6 C
- 半连接
semi_join
返回能够与y表匹配的x表所有记录
semi_join(x = test1, y = test2, by = 'x')
## x z
## 1 b A
## 2 e B
## 3 f C
- 反连接:返回无法与y表匹配的x表的所记录
anti_join
anti_join(x = test2, y = test1, by = 'x')
## x y
## 1 a 1
## 2 c 3
## 3 d 4