学习R包
什么是R包?
R包是大神们开发好的可以通过简单的命令就实现各种强大功能的函数的集合。
安装和加载R包
- 设置镜像,把下载R包的源网址设置为国内的镜像,加快下载的速度。
-
install.packages()
安装CRAN上的包
BioManager::install()
安装Bioconductor上的包
加载R包
每次使用某个R包之前都需要先进行加载。使用library()
或者require()
dplyr包
-
mutate()
:在数据框中新增加一列 -
select()
:按列序号或者列名选择指定的列 -
filter()
: 筛选满足某要求的行 -
arrange()
:按某一列或者某几列对整个表格进行排序 -
summarise()
:根据给定的函数进行汇总,结合group_by
可以进行分组汇总。
dplyr实用技能。
-
%>%
管道操作,相当于将上一函数的输出结果,作为下一个函数的第一个参数进行输入。 -
count()
统计某列的各类值的个数。
dplyr处理数据关系
根据连个数据框的某一列连接数据框
-
inner_join()
:相当于取交集 -
left_join()
:根据左边的数据框的列进行合并 -
full_join()
:相当于取两个数据框的并集 -
semi_join()
:相当于跟具第二个数据框中某一列,得到与第一个数据框匹配的值,但不输出第二个数据框。 -
anti_join()
:得到无法与第二个数据框匹配的第一个数据框中的值 -
bind_rows()
:连接两个列数一样的数据框 -
bind_cols()
:连接两个行数相同的数据框