R包是多个函数的集合。学生信,可以用r语言丰富的图表和biocductor的各种生信分析r包。这次以dplyr为例。
一. 安装加载
建立一个示例数据(使用内置数据集iris的简化版)
二. dplyr的5个基础函数
-
mutate(), 新增数列
-
select(),按列筛选
(1). 按列号筛选
(2). 按列名筛选
-
filter()筛选行
-
arrange(),按某个列或某几列对整个表格进行排序
-
summarise():汇总 结合group_by使用实用性更强
三. dplyr两个实用技能
-
%>%管道操作
- count统计某列的unique值
四. dplyr处理关系数据
将2个表进行连接,但是不要引入factor - inner_join 内连,取交集
- left_join 左连
- full_join 全连
- semi_join 半连接
- anti_join 反连接
- 简单合并,bind_rows(两个表格列数相同);bind_cols(两个表格行数相同)