引言
看过很多人做的excel 表格,存在很多不规范的地方,我们做的表格是让SPSS/stata/python等软件或者程序来处理的,所以原始的数据表格应该做成符合计算机处理的格式 而不是更符合人阅读的格式
不规范问题
下边是几个不正规的表格
要做成符合计算机处理的表格,注意几点:
- 不要有行/列合并的项;
- 最好所有的数据都放在一个大表(同一个excel同一个sheet),不要分开放,避免后期合并数据带来的不必要的麻烦,如果我要做分散在不同excel表格中的几列数据的相关分析 回归分析就省去了合并表格的麻烦;当然python/stata提供一些合并表格的函数,但是在合并过程中也还是很容易出错的;
- 问卷最好在设定问题时列举选项,不要采用主观选项;eg. 喜欢什么运动,要把主要的运动列举:足球 篮球 跑步 等等 ,如果主观选项就会出现 填选 eg. 篮球 打篮球 蓝球 等等这种给后期处理带来处理困难的麻烦。
规范的表格是什么样
所以规范的表格应该是如下:
- 没有合并的单元格,每一个格子都是单独的;
- 喜欢运动项目等这种问卷应该列举主要,把次要归为其他;eg.
1. 跑步 2. 足球 3. 篮球 .... 9. 乒乓球 10.其他;
- 表头占第一行;
- 李克特五级量表 低优/高优编码应该一致,eg. 列a: 你对京东的网页是不是满意
1. 最不满意 ... 5. 最满意;
列b:你对淘宝的网页是不是满意 (这个时候要保持一致)1. 最不满意 ... 5. 最满意
- 数据分析的数据应该是长数据,相同性质的列最好合并。 比如成绩统计,不要一列是语文 另外一列数学 还有一列物理应该 加一列科目, 一列成绩