在实操1中,我们已经知道了处理多选题需要用到【多重响应】或表中的【多响应集】,通过设定多重响应,既可以知道各个选项的占比情况,也可以根据不同的自变量进行交叉分析,了解自变量之间的显著性差异。
那当我们知道各个选项的占比情况时,各个选项之间的差异是否有统计学上的意义呢?
经过本篇文章学习,您能够对问卷数据做以下分析:
①多选题各个选项占比之间差异是否具备显著性
②多选题*单选题卡方检验
多选题*单选题卡方检验
我们看一个案例:
我们想知道不同年龄之间对于某洁面产品的认知渠道的关联关系
首先对这2个变量进行交叉分析,结果如下
以上结果清晰展示以下两点:
1.选择认知渠道为“微信公众号”的人中,18-24岁占比46.2%,25-29岁占比54.2%;
2.对于“18-24岁”,48.8%的18-24岁人来自微信公众号,45.3%的18-24岁人来自天猫/淘宝推荐,39.5%的18-24岁人来自旗舰店直播间,60.5%的18-24岁人来自宠粉群/朋友圈.......;
以上仅仅只是不同年龄各认知渠道人数的简单描述性分析结果。那么,更进一步,不同年龄的认知渠道人数的差异是否具有统计学意义?
还需要继续进行加权卡方检验(因为此时我们是对统计结果进行再次分析,这一行数据代表的并不是单个值,而是所“加权的倍数”的数据)。
将以上数据按照如下的方式录入进SPSS:(需在变量视图中设置值标签)
此时,我们将对统计数据进行加权分析
选择数据-加权个案
将“人数”选入加权个案选项,点击确定
此时,我们可以按照正常的交叉分析步骤进行分析
设置行、列变量,并选择统计量中的【卡方】
选择单元格中的行、列百分比
卡方检验结果显示:
P>0.05,说明不同年龄之间的认知渠道无显著差异。
也可以说成不同认知渠道中中,年龄的占比无差异;意味着,年龄和认知渠道之间无关联关系。
名义多选题的拟合优度检验
这种拟合优度检验不涉及第2个变量,一般针对的是一道多选题的情况
同样是对多选题的处理,我们通过多重响应可以知道这道多选题各个选项之间的频数/人数占比情况,但各个选项之间人数差异是否具备具有统计学意义?
仅通过多重响应分析无法给出P值,多重响应分析必须再结合卡方拟合优度检验,才能真正从统计学的角度得到各个选项之间的人数差异的统计学意义。
案例如下:
我们想知道人们在选购一款洁面产品时,会受到哪些因素的影响?
首先进行多重响应设置,并进行频率分析,得到以下结果:
将以上的多重响应分析的结果作为原始数据,进行卡方拟合优度检验。
首先,多重响应的结果录入进行SPSS的形式如下:
数据-加权个案
将人数变量加权
分析-非参数检验-旧对话框-卡方
P<0.05,代表用户在选择洁面产品时受到的诸多影响因素之间有显著差异
此时观察残差大小,正数代表相对偏向因素,负数代表相对不偏向因素(残差代表测量值与平均值之间的差)
由此可以看出,
相对偏向因素包括:是否温和不刺激、洗后是否紧绷、洗后是否干燥起皮、是否清洁力足够强、洗后是否假滑、气味是否喜欢、是否是氨基酸洁面、泡沫是否丰富绵密(降序排列)
相对不偏向因素包括:是否洗卸二合一、包装颜值是否喜欢、起泡速度是否快、是否好挤出、是否好携带、是否好挤出(降序排列)