2019/2/23-星期六-阴雨天
马上就要三月份了最近的心情有点小忧伤。可能春天雨多的原因。今天抽空记录一下最近学习的方差分析。
一、概念理论
方差分析大致可以分成以下三类
关于这三者的概念拆分以及spss相应的应用位置可以参考文章https://www.jianshu.com/p/82b07c0fd1cc。
总结一下方差分析就是两个或两个以上的样本均值差别的显著性检验。方差分析认为不同处理组的均数间的差别来源于组间差异(实验条件SSB:用变量在各组的均值与总均值之偏差平方和的总和)和组内差异(随机误差SSW:用变量在各组的均值与该组内变量值之偏差平方和的总和); 总偏差平方和 SSt = SSb + SSw。
均方MSw=SSB/(n-m) ,均方MSb=SSw/(m-1),(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),
MSb/MSw比值构成F分布。
使用前提条件:①各样本独立性;②服从正态分布;③方差齐性
二、问题与数据
基于问题的思考:问题希望比较不同品牌胶合板的耐磨性转化为数学问题等于品牌这个分类因素是否对磨损深度这个连续性因素有影响。因为影响因素只有一个,所以建立单因素方差分析模型。;
其中 代表不考虑具体的品牌时胶合板的平均磨损深度,代表i品牌和总的平均水平相比时平均磨损深度的差异, 代表第i中品牌下j件胶合板与i平均水平的差异。
数据链接:https://pan.baidu.com/s/1BhzJ2adnlquT5Ganjc5Aug
三、spss分析方法
1、选择Analyze→General Linear Model→Univariate (假设数据服从正态分布)
2、将磨损深度放入因变量、地板品牌放入固定因子;【选项设置】勾选【描述统计】和【齐性检验】
四、结果解读
描述统计表给出了4组数据和总体的平均值、标准偏差、个数的统计信息。可以看出四个品牌的均值D最大,C最小,A\B两种接近。A、B、C标准差接近,D的标准差较小。
F统计量为1.292,在当前自由度下对应的P(即图8的显著性值.311),可以认为各单元格所代表总体的方差齐。
由图9可见进行了三个检验,显著性有3个值。
①修正模型:对整个方差模型的检验,假设:模型中所有因素均对因变量无影响,模型只有一个因素, 均为0。可见F值为24.550,P值(.sig)< .0001,因此拒绝原假设,所有的模型具有统计学意义,其中有系数不等于0,因此可以说明品牌间有差异。
②截距:假设: ,即当不考虑品牌因素,胶合板的平均磨损深度均数为0,显然拒绝原假设。
③从第三行开始是对模型中各因素的检验,由于该问题中只有一个因素所以只检验了brand.即假设brand因素对因变量没有影响。跟①的结果一样。
所以通过以上操作可以分析出品牌对磨损深度是有影响的。
五、深入探究
问题一:能否给出对模型中参数的估计值?
选择选项,勾选参数估算值、对比系数矩阵。
结果分析:
所以可以根据上表看出=2.572;=-.162,-.168, -.526 , 0, 由于本例中参数间存在一定的数量关系,必须有加上一定的限制条件才能进行估计。模型默认将编号取值为最高的一类。即令;所以另外三个参数的估计值和检验结果实际上就相当于该水平和品牌D相比的结果。例如A的参数-.162=2.41-2.572
问题二:品牌间的磨损深度是有差异的,那么我们该如何知道那些品牌更耐磨,哪些品牌易磨损?
点击【事后比较】(有的叫两两比较)
结果分析:
由图14可以清楚地看到4种类型的磨损深度低-高排序为C--B--A--D;B跟A比较结果为0.926,无统计学差异。