上一篇文章【懒人必备】批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL推出后,有小伙伴希望可以在最后一列增加p值输出。
改进后的代码
注意事项
- 本代码用的是OneWay ANOVA的统计方法,别的统计方法需要改代码
- 由于在样本量较少的情况下,OneWay ANOVA对正态性和方差齐性都不是特别敏感,因此这个代码中没有做这两步检验,直接做了ANOVA
- 目前的代码没有做事后检验,如果需要事后检验,并且批量在各个数据上显示上标字母的话,请留言
数据准备
数据准备方式和【懒人必备】批量完成均值和SD计算,并以mean±SD的格式批量导出到EXCEL中一样
group | BW | SGR | CAT | SOD |
---|---|---|---|---|
1 | 4 | 1.2 | 21 | 2.2 |
1 | 5 | 1.4 | 22 | 2.3 |
1 | 6 | 1.5 | 23 | 2.5 |
2 | 14 | 2.2 | 33 | 3.5 |
2 | 15 | 2.4 | 34 | 3.6 |
2 | 16 | 2.5 | 35 | 3.7 |
3 | 24 | 3.2 | 43 | 4.4 |
3 | 25 | 3.4 | 33 | 4.6 |
3 | 26 | 3.5 | 45 | 4.8 |
R代码
#############################################
##
## 批量求均值和SD
##
##-----------------------------------------
## Author : Cdudu
## Data : 2019 8/14
############################################
library(readxl)
# 读入需要统计的数据表
dat<-read_excel('Data.xls')
dat$group<-as.factor(dat$group) #将group转化为因子型,否则会影响统计结果
summary(dat)
# 创建新表用于存放Mean,SD和P值,此处as.character()中向量长度由组数决定,
# 例如上表共三组,再加上p值,需要4行,就输入as.character(1:4)
dat2<-data.frame(t1=as.character(1:4))
for ( i in c(2:5)){ #此处向量根据应变量的列数决定,上表应变量在2-5列,因此输入c(2:5)
means<-tapply(dat[[i]],dat$group,mean)
means<-sprintf('%.2f',round(means,2)) #改变数字可以改变Mean的小数点位数
SD<-tapply(dat[[i]],dat$group,sd)
SD<-sprintf('%.2f',round(SD,2)) #改变数字可以改变SD的小数点位数
a<-paste(means,'±',SD)
M.aov<-aov(dat[[i]]~group,data=dat)
aov.sum<-summary(M.aov)
pvalue<-aov.sum[[1]]$`Pr(>F)`[1]
if(pvalue>0.05){a[4]<-'NS'} #a[]中的数字根据组数决定,组数+1
else if(pvalue>0.01){a[4]<-'*'}
else {a[4]<-'**'}
dat2[i-1]<-a
names(dat2)[i-1]<-names(dat[,i])
}
dat3<-t(dat2) #行列转置
write.csv(dat3,'Mean&SD.csv')
以上就是全部代码,实际操作中只需要三步操作
1.在创建dat2时,确定dat2的行数为处理组数量+1
dat2<-data.frame(t1=as.character(1:4))
2.在for循环开头,输入应变量数量
for ( i in c(2:5)){
- 在if语句中,确定p值在向量a中的存放位置,也就是处理组数量+1
if(pvalue>0.05){a[4]<-'NS'} #a[]中的数字根据组数决定,组数+1
else if(pvalue>0.01){a[4]<-'*'}
else {a[4]<-'**'}
结果展示
如果最后是将dat3输出到EXCEL,那么表格如下
NULL | V1 | V2 | V3 | V4 |
---|---|---|---|---|
BW | 3±0.2 | 4±0.3 | 5±0.4 | * |
SGR | 3±0.2 | 3±0.2 | 3±0.2 | NS |
CAT | 3±0.2 | 3±0.2 | 3±0.2 | ** |
SOD | 3±0.2 | 3±0.2 | 3±0.2 | NS |
V1;V2;V3即是3个试验组,V4是p值展示,里面的数值是我瞎编的。
- NS:p>0.05
- *: 0.05>p>0.01
- **: p<0.01
当然也可以将dat2输出到EXCEL,那么表格如下
NULL | BW | SGR | CAT | SOD |
---|---|---|---|---|
V1 | 3±0.2 | 3±0.2 | 3±0.2 | 3±0.2 |
V2 | 3±0.2 | 3±0.2 | 3±0.2 | 3±0.2 |
V3 | 3±0.2 | 3±0.2 | 3±0.2 | 3±0.2 |
V4 | NS | * | ** | NS |