什么是R包?
R包是多个函数的集合,具有详细的说明和示例。不同的R包具有不同的功能。
R包的安装
install.packages(“包”)——要安装的包存在于CRAN网站
BiocManager::install(“包”)——要安装的包存在于Biocductor
R包的加载
由于并不是说安装R包后就能直接使用,因为R语言中涉及到很多的R包,如果全是自动加载,就会导致混乱,因此,当需要什么类型的包时,临时加载即可。加载R包的命令如下:
library(包名)
或者
require(包名)
R包的安装加载三部曲(以dplyr包为例)
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr", destdir = “E:/R/RStudiowork/downloaded_packages”#更改R包下载路径))
library(dplyr)
R包的使用
dplyr的使用
利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境.
运行R包需要一定的数据
test <- iris[c(1:2,51:52,101:102),]
1.mutate(),新增列
2.select(),按列筛选
select()用列名作参数来选择子数据集。dplyr包中提供了些特殊功能的函数与select函数结合使用, 用于筛选变量,包括starts_with,ends_with,contains,matches,one_of,num_range和everything等。
语法 : select(.data, ...)
可以是列数或者是列名
3.filter()筛选行
4.arrange(),按某1列或某几列对整个表格进行排序(注意大小写)
5.summarise():汇总
dplyr两个实用技能
1:管道操作 %>% (cmd/ctr + shift + M)
以上函数都是单独使用,通过使用管道操作符将 dplyr 变形函数连接起来。
如此处加上管道操作就可以将group和summerize函数联合使用。
count统计某列的unique值
dplyr处理关系数据
也就是将两个表连接到一起