安装和加载R包
1.镜像设置
在R的配置文件 .Rprofile敲入代码
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
保存-重启Rstudio,启动时就会运行.Rprofile中的代码
2.安装
install.packages(“包”)或者BiocManager::install(“包”)
(取决于你要安装的包存在于CRAN网站还是Biocductor)
3.加载
library(包) 或者 require(包)
以dplyr为例学习R包的使用
(一)dplyr基础函数
1.mutate() 新增列
2.select() 按列筛选
(1)按列号筛选
(2)按列名筛选
3.filter()筛选行
4.arrange()按某1列或某几列对整个表格进行排序
5.summarise()汇总
可以算均值、标准差。结合group_by使用实用性强
(二)dplyr实用技能
1.管道操作 %>% (cmd/ctr + shift + M)
数据集传递?
2.count统计某列的unique值
(三)dplyr处理关系数据
1.内连inner_join,取交集
取共有的x,并对应上y和z
2.左连left_join
left_join(test1, test2, by = 'x')
以test1的x数据为准,后面连接上test2的数据
3.全连full_join
以x数据为准,test1后面连接上test2的数据
4.半连接semi_join
返回能够与y表匹配的x表所有记录
5.反连接anti_join
返回无法与y表匹配的x表的所有记录
6.简单合并
注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数