继续R语言--R包
一、安装R包
二、实例--dplyr
#配置镜像+安装+加载
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
五个基础函数
mutate()
新增列
select()
按列筛选
filter()
筛选行
arrange()
按列排序
summarise()
汇总两个使用技能
%<%
管道操作
还不是很理解管道操作,再研究研究,🔗链接
count()
统计某列的unique值处理关系数据
#将两个表进行连接
options(stringsAsFactors = F)
test1 <-tibble(x = c('b','e','f','x'),
z = c("A","B","C",'D'),
stringsAsFactors = F)
test2 <- tibble(x = c('a','b','c','d','e','f'),
y = c(1,2,3,4,5,6),
stringsAsFactors = F)
#内连inner_join,取交集
inner_join(test1,test2,by="x")
#左连
left_join(test2,test1,by='x')
left_join(test2,test1,by='x')
#全连
full_join(test1,test2,by='x')
#半连接,返回能够与y表匹配的x表所有记录
semi_join(x=test1,y=test2,by='x')
#反连接,返回无法与y表匹配的x表的所有记录
anti_join(x=test2,y=test1,by='x')
#简单合并
bind_rows(test1,test2)#需要两个表格列数相同
bind_cols(test1,test3)#需要两个表格行数相同