根据处理数据的一些流程,记录一下使用SPSS的一些步骤,除了标题的加粗,其余加粗都是指在SPSS软件中操作的具体按钮。
一、所需安装的软件
SPSS24.0,AMOS24.0, PROCESS插件
二、导入数据
1.推荐使用问卷星,直接导出SPSS格式的文件。
并对每一个变量的名称、小数位、值标签、测量(数据类别)进行调整和确认。
2.乱码处理
新建窗口-编辑-选项-语言-语言环境的书写系统-操作系统的书写系统-应用-确定
3.三线表制作
分析-表-定制表-摘要统计
(1)如何变成三线表:可将“三线表样式文件”导入SPSS文件夹下面的Looks文件夹,选择 格式-表外观-三线表 即可转换成三线表)
(2)EXCEL中生成三线表:修改字段名称后在word中 清除格式-无边框-上下框1.5磅-中间线0.75磅。
4.数据录入
(1)单选题、打分题、填空题:
每一题用一列数据来保存,值可以根据选项来设置。
(2)多选题、比重题、排序题:有多少个选项就要设置多少个题目,0代表没有选择,1代表选择,或者通过值标签提供每一个选项。题目名字可以设置成:Q1_1, Q1_2, Q1_3, Q1_4
(3)NPS量标题、Likert量标题:每个题目生成一个变量,每个变量可以设置选项值。后续分析的时候,使用量表各维度的总分(题项分数加总),量表的总分(题项分数加总),中心化处理后的维度分或总分(维度分-平均分),标准化处理后的维度分或总分来进行运算。
三、数据分析
1.描述统计
(1)直接使用三线表完成。分析-表-定制表-摘要统计
(2)分析-描述统计-描述-变量-选项-平均值、标准差、最大值、最小值 、方差、范围等
2.样本分布合理性
频率分析、卡方拟合优度检验
分析-非参数检验-旧对话框-卡方-检验变量-值-确定
(若p>0.05,则符合事先预设的分布)
3.多选题
(1)定义:
分析-多重响应-定义变量集-集合中的变量-二分法(计数值1,代表被选择)-名称-添加-关闭
多选题的描述分析:分析-多重响应-频率-确定 (缺点:定义后无法保存,下次打开要重新定义。改善:使用分析-表-多重响应表来定义)
多分类的题:分析-多重响应-定义变量集-集合中的变量-类别(1-题项数)-名称-添加-关闭
(2)可做的分析:频率分析、交叉分析、卡方检验
两种方法:a.分析-多重响应;b.分析-表。推荐第二种。
a.频率分析:可以先在分析-表-多重响应表里定义好多选题,然后使用分析-表-定制表来进行分析
b.交叉分析:一个单选题(列)和多个多选题(行);一个多选题(列)和一个多选题(行)(没有太大含义)
c.卡方检验:分析-表-定制表-检验统计-独立性检验(卡方检验)-确定
(单元格数值若<5,表明卡方检验结果不可靠,即不适合做卡方检验)
一般不会针对多选题和多选题做卡方检验,只会针对单选题和多选题做卡方检验。如果存在小于5的单元格,则不做卡方检验。
4.克隆巴赫系数
分析-标度-可靠性分析
5.相关分析
分析-相关-双变量-选项-平均值和标准差
6.中心化处理
(1)分析-描述统计-描述-平均值
(2)转换-计算变量-M_()=()-平均值
7.标准化处理
(1)分析-描述统计-描述-将标准化值另存为变量
8.调节效应
(1)中心化处理or标准化处理
(2)算交互项:(中心化以后的)自变量x调节变量
方法1:层级回归模型:分析-回归-线性-因变量,自变量-下一个-交互项-统计:R方变化量-确定
方法2:Process处理:分析-回归-process-model1-因变量,自变量,调节变量(不放交互项)-确定
(若y对x、z和xz的回归R方显著高于y对x、z的回归R方,则调节效应显著)
(int-1是交互项,也可以看它的系数的显著性,若显著,则调节效应显著)
9.中介效应
(1)中心化处理or标准化处理
(2)方法1:层级回归模型
a.分析-回归-线性-因变量Y,自变量X-确定
b.分析-回归-线性-因变量M,自变量X-确定
c.分析-回归-线性-因变量M,自变量X,M-确定
(3)方法2:Process处理:
分析-回归-process-因变量Y,自变量X,M-model4-options(sobel,total)-继续-确定
(若报错,是因为字符长度太长,变量名称改成字母)
(若bootstrap的区间不包含0,则中介效应显著;若包含0,则中介效应不显著)