数据格式,直接影响着分析结果是否准确。小编最近也收到一些关于“数据格式”的提问,不知道自己的数据应该整理成什么格式上传分析?
正好在这里统一分享几种常见的数据格式,包括问卷数据、实验数据、时序数据、面板数据以及一些特殊数据格式。希望今天的文章,能够帮助你解决数据格式方面的困扰。
一、问卷数据
问卷数据是大家最常会用到的。此类数据的特点是:一行代表一个样本,一列代表一个属性。
这类格式携带着所有原始的数据信息,适用于各种分析方法。推荐大家将数据整理成此类格式。
多选题
问卷数据可能涉及多选题录入。单选题录入就是简单的一个问题为一列。根据答题者的选项,选择哪个选项就把相应的序号填入即可。
录入多选题时,要将多选题每一个选项看作一个单选题。选择录入为1,不选择录入为0。有几个选项就要录入几列。
开放题
除了单选题、多选题,问卷研究中还有一类开放题型,如填空题。
文本格式系统无法直接分析。如果是在问卷平台中生成的数据,建议大家导出[数字格式]的数据,再上传到系统进行分析。
如果是手动录入,建议先在EXECL里整理,把意思相近的答案归为一类提取出关键词表示,这样后续可以采用频数、词云分析等。
二、实验数据
实验数据常见有两种:一种是加权数据格式,一种是配对数据格式。
加权数据格式,这类数据常见于医学研究中。此类数据是整理的汇总统计数据,不能直接分析。一定要先进行加权处理。
加权数据的特点是数据中一定有:两个变量(“组别”和“疗效”)各占一列,还有一列表示频数(加权项)。
分析时,需将加权项放入加权项【可选】框里。
所有数据中,只有定类数据才能整理成加权格式,因此,这类数据只能应用在一部分研究方法上。SPSSAU中支持加权数据的研究方法包括如下:
配对数据格式,常见于配对实验设计中,涉及的研究方法包括配对t 检验,配对卡方等。可比较实验组和对照组数据的差异或干预前后数据的差异。
配对数据的特点为:行数一定完全相等并且只有两列。分析时一定要特别注意。
三、时间序列数据
时间序列数据的格式包括时间和实际分析项共两列。此类数据有明显的时间顺序,且顺序不能更改,一定是从上至下日期递增,中间不能有间隔。
四、面板数据
面板模型是针对面板数据进行分析,面板数据是一种特殊的数据格式。
这类数据的特点是可以同时取得时间和个体两个维度的数据。
使用SPSSAU进行分析时,需要注意录入个体ID(公司编号)和时间(年份)这两列数据。
个体ID’就是上图中的‘公司编号’,‘时间’就是‘年份’。‘公司编号’和‘年份’两项共同用于提示系统当前为面板数据。
五、特殊数据格式
还有一些比较特殊的数据格式。如综合评价里的模糊综合评价、灰色关联法等。
建议使用这些方法之前,参考帮助手册中的格式说明或视频教程。
同时帮助手册中也提供了多种数据格式说明,大家可以直接搜索进行查看。
-END-