在进行问卷研究时,很多时候都会使用到多选题,多选题很容易理解,而且很多场合时都需要使用多选题进行数据收集。
但当进行分析时会遇见一种尴尬,即只能做最简单的频数,计算个数或者计算下简单的百分比,使得分析比较简单,更谈不上‘高大上’。
今天小编便详细讲解下多选题的‘高大上’分析方法,以及分析的后台原理,并且借助SPSSAU分析平台进行讲述具体如何操作。
计算百分比,普及率和响应率,帕累托图这三种方法都是通过百分比计算,通过不同的展现形式进行分析,相对使用较多。
如果是想使用统计检验的方法进行分析差异性,那么就需要使用CochranQ检验、卡方检验法。
同时还有一种高级的多元统计方法叫对应分析也可以针对多选题进行分析。接下来咱们结合案例慢慢讲述。
数据格式
当前有一项研究电子商务网购平台的偏好数据,并且想分析学历与网购平台的偏好差异性情况。总共收集200个样本,数据如下图所示(图中仅列出10个样本数据)。
多选题的数据格式相对较为特殊,1个选项就会占用一列,并且使用数字1表示选择了该项,数字0表示没有选择该项。
本次网购平台偏好这个多选题共有7个选项,因此数据中有7列。除此之外还有一个学历单选题,单独占一列数据。学历中的数字,数字1代表本科以下,数字2代表本科,数字3代表硕士,数字4代表博士。
需要特别注意地,多选题的数据格式一定并且只能是这样,一个选项为一列,并且使用数字1表示选择,数字0表示没有选择。
在了解完多选题的数据格式后,接着利用SPSSAU平台进行上述六种分析技巧的说明。
1.计算百分比
很容易的想到,通过百分比方式了解研究群体对于网购平台的偏好,是一种很自然的做法。
当前有200个样本,比如有98个选择了拼多多,那么选择比例就是98/200=49%,类似其它6项也一样,这种计算百分比的方法最为简单,使用也最多,而这种百分比在专业上称作‘普及率’。
具体SPSSAU的操作如下图:
SPSSAU多选题分析
分析结果
上图展示了各项的选择比例,‘天猫’的占比最高为49%,即说明网购平台中天猫的使用率最高,其次是‘京东’,占比是40.5%。除了使用柱形图进行展示,也可以使用条形图,并且对数据进行排序展示等。
2.普及率和响应率
除了上述的基本百分比分析之外,还可进一步利用深入分析。比如本次案例里面98个样本选择‘天猫’,总样本是200个,占比是98/200=49%。这种百分比叫做‘普及率’。除此之外还有一种占比叫做‘响应率’,如下图:
总共200个样本,每个样本可以选择多个选项,一共加起来200个人选择了297个选择,平均一个人选择297/200约为1.5个选项。如果当前想了解相对来看各选项的选择占比,此时就可以使用响应率进行分析,比如总共有98个人选择天猫,全部被选中的项为297个,所以占比为98/297=33.00%。
响应率是一种各选项的选择相对占比指标,更加强调选项之间的PK,因为各个比例的加和一定为100%,所以选项之间可以进行PK对比。
而普及率是一种人群的占比,更加强调样本中有多少比例选择某项。两个指标值的侧重点不一样,如果深入一点的分析,通常需要对响应率进行分析。当然响应率也可以使用图形进行表达,如下图:
想得到响应率指标的计算,事实上依旧是使用SPSSAU【问卷研究】里面的多选题进行操作即可,SPSSAU在此分析方法时会输出非常多的指标,包括接下来的帕累托图。
3.帕累托图
在多选题设计时,很多时候我们想找到某个问题发生的原因,比如说银行服务柜台不满意的地方有哪些?多选题选项分别有:服务态度、等候时间、银行网点少等等很多个原因,从银行角度来看,出现客服对于柜台不满意的原因有很多,首先需要抓住重要的原因,可根据2/8原则进行分析,20%的事情导致了80%的不满意,比如服务态度这一项做好了,可能客服的满意度就会提升80%,帕累托图正是基于2/8原则进行分析。
SPSSAU里面有两个地方可进行帕累托图分析,包括【可视化】--【帕累托图】,和"多选题"里面默认生成的帕累托图。
帕累托图是利用2/8原则进行分析的一种思想,并且使用图形进行展示,一般是为了找到某方面的原因,最大的问题情况等。本次案例的背景并不满足这一点,所以仅列个图,但是不能进行分析。
4.CochranQ检验
上述3种办法,均是通过百分比,画图形式进行展现。如果是进行统计研究,或者为了得到更加精确的差异对比结果,此时就需要使用统计方法进行分析比较差异。
多选题的数据格式是只有两个数字1和0,1代表选择0代表没有选择。1个样本对一个多选题的多个选项进行作答(答案是选择或者不答案)。
这种数据在统计专业上叫做‘多相关样本’数据。刚好有一种统计检验方法可做差异检验即CochranQ检验。
SPSSAU【实验/医学研究】里面可以找到CochranQ检验,把多选题的7个选项放到右边框中,开始分析即可。
得到结果如下:
进行统计检验时,首先看P值,上表格中P值为0.000,那么说明具有显著性差异,即针对7个选项(分别是拼多多,京东,天猫,苏宁,当当,唯品会和其它)的选择比例上有着显著性差异。
这就从统计上证明了各个选择比例具有差异,那么具体差异情况如何呢?可通过SPSSAU输入的表格,当然还有下图进行详细说明。
上图中明显可以看到,天猫和京东的选择比例明显最高属于第一梯队,当当,唯品会这两项的选择比例属于第三梯队。
5.卡方检验
除了CochranQ检验外,有时候需要进行差异对比,比如本次例子中,想对比不同学历的群体,他们选择网购平台的偏好上是否有明显的差异性呢?此时就可使用SPSSAU的‘单选-多选’方法,学历是单选,网购平台偏好是多选,操作如下:
SPSSAU默认输出的第一个表格里面就包括了卡方检验的结果,卡方检验是分析差异的一种非常常用方法。
首先看P值,P值为0.000<0.01,意味着各学历群体,他们对于网购平台的偏好上有着显著性的差异,即各学历群体他们很可能使用不同的网购平台。
当然具体差异情况还是需要通过表格,以及图形进行展示,比如使用下图进行展示:
6.对应分析
如果分析学历和网购平台偏好的差异性,那么可使用卡方检验,卡方检验是利用差异的原理进行分析。
还有一种更高级的多元统计方法叫做‘对应分析’,其是利用‘相关’的原理,比如高学历群体有没有更偏好于京东平台呢,低学历有没有更偏好于拼多多呢。
如果想得到这样的分析,使用对应分析是一种最适合的方法,因为它可以通过一张图(对应图)非常直观的展示这种关系情况。
对应分析不同于常见的图形展示或者统计检验,它是一种高维投映到低维,并且使用散点化的形式将相关的点全部落在一张图上,非常直观形象地展示结果。
SPSSAU对应分析
使用SPSSAU【问卷研究】--【对应分析】即可做到,需要特别说明的一点时,一般‘单选-多选’或者‘多选-多选’分析后才需要进一步对应分析,而且对应分析的数据格式相对较为特殊(通常是加权数据格式),但不用担心,SPSSAU默认就在页面输出了需要进行对应分析的数据格式,比如下图:
本次案例进行对应分析后,得到对应分析的‘对应图’如下:
上图可以看到:本科、硕士、天猫、京东和唯品会这几个点挨在一起,其说明了本科和硕士这两类群体,他们使用天猫、京东和唯品会这3个平台的偏好更强。而本科以下,其它与拼多多挨在一起,说明本科以下低学历群体更可能使用拼多多。除此之外,博士学历群体更偏好于使用苏宁。
其实对应分析最方便的是可一张图看出对应关系,并且利用‘画圈’把关系情况标识出来。当然也可以结合选择百分比等进行分析,其结论实质上一样,但对应分析更加方便直观,当然其统计原理也更‘高级’,很多分析人员出于不会或者担心而不使用这一高级分析方法有点可惜,SPSSAU建议分析多选题交叉关系时,使用对应分析直观展示关系情况。
7.其它说明
除了上述涉及到多选题的分析技巧外,有时候还可能分析多选题和多选题之间的关系,也或者多选题和单选题之间的关系,均可通过SPSSAU【问卷研究】里面实现。