安装加载三部曲
options("repos"=c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr"→可换成其他R包的名字)
library(dplyr)
dplyr五个函数
-
mutate()
新增列 -
select()
按列筛选 -
filter()
按行筛选 -
arrange()
按某1列或某几列对整个表格进行排序
默认从小到大,arrange(变量,desc(列名))
从大到小 -
summarise()
汇总
group_by()
按xx分组
dplyr两个实用技能
管道操作
%>%(cmd/ctr+shift+M)
管道运算符%>%
:将一个函数的输出传递给另一个函数作为参数统计某列的unique值
count()
dplyr处理关系数据
- 内连
inner_join()
,取交集 - 左连
left_join()
- 全连
full_join()
- 半连接:返回能够与y表匹配的x表所有记录
semi_join()
- 反连接:返回无法与y表匹配的x表所有记录
anti_join()
- 简单合并
bind_rows()
需要两个表格列数相同
bind_cols()
需要两个数据框有相同的行数