重新编码为不同变量的应用场景十分广泛,它主要为了重新清洗数据,更直观地展示我们的统计结果。
例如:多道判断对错题,我们想知道每个人的正确率情况。经过重新编码为不同变量,可以将正确选项赋值为1,错误选项赋值为0,这样就得到每个人的正确率情况。
经过本篇文章学习,您能够对问卷数据做以下分析:
①重新编码为不同变量
②统计重新编码后的数据,用于直观展示统计结果
重新编码为不同变量
我们看一个案例
示例1:一共有6道正确错误判断题,统计每个人的正确情况
1.转化-重新编码为不同变量
(这里还有一个按钮是重新编码为相同变量,2者有什么差异呢?)
重新编码为相同变量:直接替换掉原始数据列
重新编码为不同变量:新增一列重新编码后的数据
为了不破坏原始数据,我们在操作时建议选择【重新编码为不同变量】
2.找到我们需要编码的几个判断题,我们共有6道判断题,这里需要一个一个编码,先不要全选过去
3.选择一个判断题过去,点击旧值和新值
4.先看一下Q18这道题开始的判断题是怎么设置的——
Q18这道题本身设置的是一道错误的描述,选择1代表他认为正确,选择2代表他认为错误
这时候重新编码的意义在于,若他选择的2代表他这道题回答正确,否则回答错误
这时候就需要将2重新赋值为1,将1重新赋值为0,这样所有回答1的(回答正确的),就会被我们统计下来
以下是操作————
5.编辑一个新的变量名称,一定要点击【更改】,否则无法点击确定
6.点击确定后,会显示EXECUTE,代表程序已经为你完成了本次重新编码操作
7.我们再回到数据视图里面,看看重新编码后的这道题变成了什么样子
已经根据我们的设定出现一列新的变量
8.我们将这个步骤重复6遍,就能得到每道题的正确情况
9.统计每个人的正确率
转换-对个案内的值计数
将重新编码的6个新变量选入【数字变量】,并在目标变量处取一个新的名称【成分正确率】,设置【定义值】,点击确定
设置定义值,我们想要统计1的个数有多少,代表他的正确个数有多少,因此这里选择值为1,点击继续
显示EXECUTE,代表已经完成这项统计操作
现在已经出现了一列新的变量【成分正确率】,将每个人的正确率情况统计成新的一列