用研常用的数据主要有两种:
1.问卷调研数据:包括网络收集的数据和线下访谈收集的数据,主要有单选题、多选题和开放题,但是线下访谈的数据多为文字形式,
属于质性资料,需要借助于分词和主题挖掘进行分析,形式有频数形式统计的
2.行为数据:包括前端打点数据、后端操作数据
目前自己使用的分析工具主要有:
1.spss、python、amos、excel
2.当数据量超过10w+时,spss就会显得力不从心,打开总是崩溃,这个时候就需要灵活又强大的python了,Python不仅可以处理这样大批量的数据,而且还可以通过jiba包对收集到的质性资料进行分词和挖掘,如果再会点js,就能做出各种比较美观的图表来,小豆角本人最近正在跟一个用研方面的质性资料可视化项目,后期出来结果了,可以把一些经验在这里梳理一下,下面我们主要来写写在用SPSS进行分析时用到的方法和一些基础步骤。
SPSS分析步骤:
一、 菜单操作
1.1 描述统计:在用研中使用的比较多的是描述统计,主要有以下的指标
主要步骤有:分析-描述统计-描述或者频率。
注:在这里主要解释一下标准差,是各数据偏离平均数的距离的平均数,表示数据的离散程度,平均数相同的两组数据标准差不一定相同,标准差大的说明数据组内各变量之间的差距相对较大。
1.2 交叉分析:主要用来比较各组的分布状况,从而寻找变量间的关系。得到两个变量各水平的频数分布表,又称频数交叉表。
主要步骤:分析-描述统计-交叉表格
注:由于交叉分析包含频率统计,做交叉分析就不用做频率统计了;交叉分析多用于定类变量和定序变量。
1.3 多选题分析:多选题的每一个选项基本都是按照0、1录入的,先要做多重响应,告诉软件哪些题目属于同一个选择题。
主要步骤:分析-表-多响应集
将左边同一个选择题下的选项选入中间集合中的变量:编码类型-新变量起名-添加-确定
在变量编码中:0/1编码的多选题,选二分法,记数量=1,非0/1编码的多选题选类别。
二、图形界面操作
主要步骤: 分析-表-定制表 将需要分析的变量分别拖入行和列,添加汇总统计-列N%,分类和统计-总计,确定。
三、假设检验
假设检验是统计推断的一种基本思想,包含多种具体的方法。
原理:小概率事件在一次实验中几乎是不可能发生的,如果发生了,说明原假设有问题,那么应该拒绝原假设,接受备择假设。
适用范围:变量类型是分类变量和定距变量、变量分布符合正态分布、几组变量方差齐性。
检验方法:
列1列2列3
H0举例抽象方法
某APP,用户月平均启动次数=90比较一个变量和一个数值单一样本T检验
男女用户使用某APP次数一样一个变量分两组比较独立样本T检验
某APP,7月份和8月份用户的平均使用时长相等比较同一个变量两次测量是否有差异配对样本T检验
单样本T检验
主要步骤:分析-比较平均值-单样本T检验,显著性<0.05说明小概率事件发生了,应拒绝H0,接受备择假设。
独立样本T检验
主要步骤:分析-比较平均值-独立样本T检验,分组变量-使用指定值(组1=1,组2=2)-继续-确定
方差齐性检验:显著性主要用来判断,两组的方差是否相当,T检验方法选择是否合适
方差不齐性检验:显著性>0.05,说明小概率事件发生了,应该接受原假设,即两组用户使用app的次数没有差异。
配对样本T检验:分析-比较平均值-配对样本T检验-选择变量1-选择变量2-确定
显著性<0.05,说明小概率事件发生了,拒绝原假设,7月份和8月份用户平均使用时长不相等。