更新项目
在上一篇文章【懒人必备】【增加P值输出】R批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL的基础上,增加了事后检验及各组间差异字母的标注
注意事项
- 本代码适用于OneWay ANOVA统计方法,别的统计方法需要改代码
- 由于在样本量较少的情况下,OneWay ANOVA对正态性和方差齐性都不是特别敏感,因此这个代码中没有做这两步检验,直接做了ANOVA
- 本代码事后检验方法用的是LSD,如果需要使用其他事后检验方法,需要修改代码
数据准备
数据准备方式和【懒人必备】批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL中一样,将数据按下表的形式整理好,自变量放在第一列,指标放在后面几列
group | BW | SGR | CAT | SOD |
---|---|---|---|---|
1 | 4 | 1.2 | 21 | 2.2 |
1 | 5 | 1.4 | 22 | 2.3 |
1 | 6 | 1.5 | 23 | 2.5 |
2 | 14 | 2.2 | 33 | 3.5 |
2 | 15 | 2.4 | 34 | 3.6 |
2 | 16 | 2.5 | 35 | 3.7 |
3 | 24 | 3.2 | 43 | 4.4 |
3 | 25 | 3.4 | 33 | 4.6 |
3 | 26 | 3.5 | 45 | 4.8 |
R代码
#############################################
##
## 批量求均值和SD
##
##-----------------------------------------
## Author : Cdudu
## Data : 2019 8/24
############################################
library(readxl)
library(agricolae) #事后检验需要用到的包
# 读入需要统计的数据表
dat<-read_excel('Data.xls')
dat$group<-as.factor(dat$group) #将group转化为因子型,否则会影响统计结果
summary(dat)
# 创建新表用于存放Mean,SD和P值,此处as.character()中向量长度由组数决定,
# 例如上表共三组,再加上p值,需要4行,就输入as.character(1:4)
dat2<-data.frame(t1=as.character(1:4))
for ( i in c(2:5)){ #此处向量根据应变量的列数决定,上表应变量在2-5列,因此输入c(2:5)
means<-tapply(dat[[i]],dat$group,mean) #计算均值
means<-sprintf('%.2f',round(means,2)) #改变数字可以改变Mean的小数点位数
SD<-tapply(dat[[i]],dat$group,sd) #计算SD
SD<-sprintf('%.2f',round(SD,2)) #改变数字可以改变SD的小数点位数
M.aov<-aov(dat[[i]]~group,data=dat) #检验方差
aov.sum<-summary(M.aov)
pvalue<-aov.sum[[1]]$`Pr(>F)`[1] #提取p值
if(pvalue>0.05){
a<-paste(means,'±',SD)
a[4]<-'NS'
} #a[]中的数字根据组数决定,组数+1
else if(pvalue>0.01){
out <- LSD.test(M.aov, "group", p.adj="none") #事后检验
marker<-out$groups
#下面三列代码的目的是将marker按分组顺序重新排序
row_name <- row.names(marker)
newmarker <- data.frame(row_name,marker$groups)
newmarker <- newmarker[order(newmarker$row_name),]
#排序结束
pmarker<-newmarker$marker.groups #提取marker
a<-paste(means,'±',SD,pmarker)
a[4]<-'*'
}
else {
out <- LSD.test(M.aov, "group", p.adj="none") #事后检验
marker<-out$groups
#下面三列代码的目的是将marker按分组顺序重新排序
row_name <- row.names(marker)
newmarker <- data.frame(row_name,marker$groups)
newmarker <- newmarker[order(newmarker$row_name),]
#排序结束
pmarker<-newmarker$marker.groups #提取marker
a<-paste(means,'±',SD,pmarker)
a[4]<-'**'
}
dat2[i-1]<-a
names(dat2)[i-1]<-names(dat[,i])
}
dat3<-t(dat2) #行列转置
write.csv(dat3,'Mean&SD.csv')
以上就是全部代码,实际操作中只需要三步操作
1.在创建dat2时,确定dat2的行数为处理组数量+1
dat2<-data.frame(t1=as.character(1:4))
2.在for循环开头,输入应变量数量
for ( i in c(2:5)){
- 在if语句中,确定p值在向量a中的存放位置,也就是处理组数量+1
if(pvalue>0.05){a[4]<-'NS'} #a[]中的数字根据组数决定,组数+1
else if(pvalue>0.01){a[4]<-'*'}
else {a[4]<-'**'}
EXCEL输出结果
如果是将dat3输出到EXCEL,那么表格如下
NULL | V1 | V2 | V3 | V4 |
---|---|---|---|---|
BW | 3±0.2a | 4±0.3b | 5±0.4c | * |
SGR | 3±0.2 | 3±0.2 | 3±0.2 | NS |
CAT | 3±0.2a | 3±0.2b | 3±0.2c | ** |
SOD | 3±0.2 | 3±0.2 | 3±0.2 | NS |
V1;V2;V3即是3个试验组,V4是p值展示,里面的数值是我瞎编的。
- NS:p>0.05
- *: 0.05>p>0.01
- **: p<0.01
当然也可以将dat2输出到EXCEL,那么表格如下
NULL | BW | SGR | CAT | SOD |
---|---|---|---|---|
V1 | 3±0.2 | 3±0.2a | 3±0.2a | 3±0.2 |
V2 | 3±0.2 | 3±0.2b | 3±0.2b | 3±0.2 |
V3 | 3±0.2 | 3±0.2c | 3±0.2c | 3±0.2 |
V4 | NS | * | ** | NS |
批量将标记字母设为上标
需要注意到的是,R导出到EXCEL的结果中虽然带了表示各组显著性差异的标记字母,但是这些字母的格式并没有被设定为上标。
因此需要在WORD中完成格式的设定,同样一个个修改太麻烦,推荐一个批量修改的方法,具体步骤如下
- 将EXCEL中的数据拷贝到WOED中
-
点击替换,在查找内容中输入[a-z],并勾选使用通配符
-
点击替换为,然后点格式
- 选择格式-字体-上标-确认
- 全部替换
大功告成
这个懒汉系列终于也算告一段落了,呼...