提取列
对列进行选择 select 函数
提取行
对行进行选择 filter 函数
slice():按位置提取行
filter():提取符合特定逻辑条件的行。 例如,iris%>%filter(Sepal.Length> 6)。
filter_all(),filter_if()和filter_at():过滤变量然后选择行。 这些函数复制所有变量或变量选择的逻辑标准。
sample_n():随机选择n行
sample_frac():随机选择一小部分行
top_n():选择变量排序的前n行
根据某一列合并表格
# 保存左侧完整表格
left_join(table1,table2,by="相同的列名") # 两列列名称不同使用(c ("X1"="Y1"))
right_join # 保存右侧
full_join # 取并集
inner_join # 取交集
删除重复行
# 根据所有列删除重复的行(完全一样的观测值):
my_data %>% distinct()
# 根据特定列删除重复值
my_data %>% distinct(Sepal.Length, .keep_all = TRUE)
# 根据多列删除重复值
my_data %>% distinct(Sepal.Length, Petal.Width, .keep_all = TRUE)
# 选项.kep_all用于保留数据中的所有变量。
根据一个或多个列值删除重复行:my_data%>%dplyr :: distinct(Sepal.Length)
R base函数从向量和数据帧中提取唯一元素:unique(my_data)
R基函数确定重复元素:duplicated(my_data)
对某一列重命名
colnames(表格名称)[列数] <-"重命名"
colnames(gene_raw_express_data)[1] <-"Gene_ID"