今天依旧跟大家分享一个在SPSS中使用率比较高的分析方法:卡方检验。
在开始做分析之前,我们需要明白两件事情:卡方检验是什么?一般用来干什么?我们只有充分了解分析方法以后才能够正确的使用它。
卡方检验在百科中的解释是:卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。它的原理是:统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
了解了卡方检验,我们就进入到今天的分析当中来。首先来看我们要做的卡方检验数据:由于工作需要,需要统计一种药物在植物使用前后发病情况是否有差别,我们将数据分成两组,一个实验组一个对照组,每组各有200株植物,在使用药物一段时间以后发现,实验组发病植物株数为28,未发病植物株数为172。对照组发病植物株数为60,未发病植物株数为140。
首先,我们需要根据题目建立下图的表格:
我们将数据归纳整理以后录入到SPSS中:
在录入数据时,我们需要针对实验组别以及是否发病进行值标签的添加,在上图中,组别列的1代表实验组,0代表对照组。是否发病列中1代表发病,0代表未发病。相关设置见下图:
在设置完成以后我们可以通过点击工具栏上面的值标签按键进行查看我们的值标签是否有误:
在把数据全部录入完成以后,我们开始我们今天的卡方检验,看看两组发病率是否是否有差别。首先我们需要对频数,也就是植物株数进行加权:
在分析之前一定不能忘记对频数进行加权,因为如果不进行加权而直接进行卡方分析是会容易出错的,这样的话直接会影响到整个分析结果。加权以后,我们就可以进行卡方检验了:
通过点击工具栏中的分析—统计—交叉表,我们就会进入到如下界面:
在界面中,我们将组别和是否发病分别添加到行与列当中(顺序可以调换,不固定),在右边的统计量选项中勾选卡方,其他地方保持系统默认就可以。确定以后就可以出现本次卡方分析的结果:
从结果中我们可以看到,前两个图主要是对数据样本量进行了统计和整理,我们主要是通过第三个图—卡方检验来进行判断的。从结果我们可以看到Pearson卡方值为14.918,对应的显著性P值为0.000(不代表值为零,只是趋近于0)<0.05。说明我们本次实验中两个组别的发病率是有差别的。到这里,今天的卡方检验就全部做完了。
加上之前给大家分享的分析方法,已经给大家分享了在SPSS中比较常见的四种分析方法了,分别是回归分析、相关分析、方差分析以及今天的卡方检验。我们一定要灵活运用这些分析方法,因为一般在实际工作中往往一整套的分析下来,我们会用到不同的分析方法,我们需要对各个分析结果进行解读,才能够得到我们需要的最终结果。
快乐学数据分析,关注公众号:小白数据营;Q群:514581193