1.安装和加载R包
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #镜像设置
install.packages("dplyr") #安装dplyr包
library(dplyr) #加载dplyr包
2.dplyr包五个基础函数
-
mutate()
,新增列
-
select()
,按列筛选
1.按列好筛选
2.按列名筛选
-
filter()
筛选行
-
arrange()
,按某1列或某几列对整个表格进行排序
-
summarise()
:汇总(结合group_by使用实用性强)
3.dplyr两个实用技能
- 管道操作 %>% (cmd/ctr + shift + M)
(加载任意一个tidyverse包即可用管道符号)
- count统计某列的unique值
4.dplyr处理关系数据
- 內连
inner_join()
取交集
- 左连
left_join()
- 全连
full_join()
- 半连接:返回能够与y表匹配的x表所有记录
semi_join()
- 反连接:返回无法与y表匹配的x表的所记录
anti_join()
- 简单合并
bind_rows()
和bind_cols()