R包
1 安装和加载
- CRAN镜像是R默认使用的R包仓库,install.packages()只能用于安装发布在CRAN上的包。
- Bioconductor是基因组数据分析相关的软件包仓库。
- 一次性配置好镜像源
(1)file.edit('~/.Rprofile')
(2)保存——直接使用即可 -
install.packages(“包”)
R包安装 -
BiocManager::install(“包”)
Biocductor安装 - 调用:
library(包)
require(包)
eg:dplyr包:数据分析包
dplyr五个基础函数
test <- iris[c(1:2,51:52,101:102),]
-
mutate(test, *new* =*A+B*)
新增列
-
select(test,*1*)
筛选列
- 筛选行:
filter(test, Species == "setosa")
filter(test, Species %in% c("setosa","versicolor"))
-
arrange(test, Sepal.Length)
按某1列或某几列对整个表格进行排序
-
summarise()
汇总
dplyr两个实用技能
1 %>%
管道操作 (cmd/ctr + shift + M)将上一个函数结果作为下一个函数的第一个参数
2 count(test,Species)
统计某列的unique值
dplyr处理关系数据
eg:1 inner_join(test1, test2, by = "x")
內连inner_join,取交集(test1和2均有“x”,所以等值连接把两张表里x相同的连接起来)
2 left_join(test1, test2, by = 'x')
左连left_join(test1的左为左,test2右为右,保留test1左侧x所有,对应test2补上,没有的天NA)
3 full_join( test1, test2, by = 'x')
全连full_join
4 semi_join(x = test1, y = test2, by = 'x')
半连接:返回能够与y表匹配的x表所有记录semi_join
5 anti_join(x = test2, y = test1, by = 'x')
反连接:返回无法与y表匹配的x表的所记录anti_join
6 简单合并:bind_rows(test1, test2)
两个表格列数相同;
bind_cols(test1, test3)
两个数据框有相同的行数