SPSS-描述性分析

一、数据处理

1、数据导入

 step1:单击【文件】-【打开】-【数据】,弹出【打开数据】对话框。在左上角的【查找范围】找到文件所在位置,下方【文件类型】右侧下拉菜单中根据文件类型选择对应的类型。本文导入的是CSV文件,如下图1-1,单击【打开】,进入【文本导入向导】对话框。

图1-1

step2:在弹出的【文本导入向导-第1/6步】对话框中(图1-2),观察一下各变量间的安排方式,单击【下一步】。step3:在弹出的【文本导入向导-第2/6步】对话框中,根据本例变量的安排方式选择【分隔】,文件开头是否包含变量名称选择【否】,如图1-3,单击【下一步】。step4:在弹出的【文本导入向导-第3/6步】对话框中,进行个案设置,保持默认设置即可,单击【下一步】,如图1-4。step5:在弹出的【文本导入向导-第4/6步】对话框中,SPSS根据导入数据特点,自动勾选【制表符】分隔符,如图1-5,单击【下一步】。

图1-2
图1-3
图1-4
图1-5

step6:在弹出的【文本导入向导-第5/6步】对话框中,选中【数据预览】下的变量列,然后依次分别设置【变量名称】和数据格式。单击【下一步】;在弹出的【文本导入向导-第6/6步】对话框中,可根据需要,选择是否保存刚才设置过的格式或者获得导入过程的语法,单击【完成】,就成功导入SPSS了。

图1-5-1
图1-5-2
1-5-3
图1-6

2、数据计算

step1:单击【转换】-【计算变量】,弹出【计算变量】对话框。在左上角的【目标变量】中输入计划生成的变量‘AGE’,在右侧【函数组】下拉菜单中找到所需的函数,本例中选择‘抽取日期’,在【函数和特殊变量】下选择‘Xdate.Year’,右上方【数字表达式】框中输入‘2020-XDATE.YEAR(BIRTHDAY)’,如图2-1,单击【确定】。返回‘数据视图’,可以看到生成了行的一列变量‘AGE’,如图2-2。

图2-1
图2-2

3、数据清洗

(1)筛选重复项

step1:单击【数据】-【标识重复个案】,弹出【标识重复个案对话框】,将变量'USERID'移到右侧框中,单击【确定】。此后可以看到‘数据视图’中多了变量——‘最后一个基本个案’,其中1代表非重复数据,0代表重复数据,选中此列,鼠标右击,在弹出的菜单中选择【升序排列】,可以看到最小值也为1,说明不存在重复项。由于该列变量在分析时无用,可以删除。

图3-1
图3-2

(2)缺失值和异常值处理

step1:单击【分析】 -【描述统计】-【描述】,打开【 描述性】对话框,将‘AGE’变量移到右侧 【变量】框中,勾选下方的【将标准化得分另存为变量(Z)】,如图3-3,单击【确定】。返回‘数据视图’,看到多出变量‘ZAG’,本例中ZAG的绝对值大于2的视为异常值(将±2δ 以外的数据视为异常值),如图3-4。

图3-3
图3-4

step2:单击【分析】 -【描述统计】-【探索】,打开【 探索】对话框,将‘ZAGE’变量移到右侧 【因变量列表】框中,勾选下方的【统计量】,如图3-5,单击【确定】。输出图3-6,根据图3-6中统计量可知:样本总计101535个,有效值共计32075个,存在缺失值;极大值和极小值的绝对值大于2,存在异常值。

图3-5
图3-6

step3:单击【数据】 -【选择个案】,打开【 选择个案】对话框,勾选右侧【选择】下的【如果条件满足(C)】项,如图3-7,【输出】下方根据需要勾选,本例勾选【过了掉未选定的个案】,单击【如果(I)...】,进入【选择个案:if】对话框。在公式框中输入‘ABS(ZAGE) <= 2&AGE ~= 0’,将缺失值和异常值过滤掉。如图3-8.此后可以看到‘数据视图’中多了变量——‘filter_$,其中1代表被选择,0代表未被选择。如图3-9.

图3-7
图3-8
图3-9

4、数据分组(对年龄)

step1:分组前,先查看一下筛选后的数据情况,单击【分析】-【描述统计】-【频率】,进入【频率】对话框,将‘AGE’移到中间变量框中,点击右侧【统计量】,选择【众数】、【最小值】、【最大值】,点击【继续】如图3-10;点击【图表】,勾选【直方图】,见图3-11,点击【继续】,单击【确定】。从输出结果可以看到,有效值有30201个,年龄最小18岁,最大59岁,同年龄人数最多的是33岁;年龄分布基本服从正态分布。

图3-10
图3-11
图3-12

step2:单击【转换】 -【重新编码为不同变量】,打开【 重新编码为其他变量】对话框,将‘AGE’变量移到中间框中,在右侧【输出变量】-【名称】下输入‘AGE_GROUPS’,点击【更改】,如图3-13。点击【旧值和新值】,进入【 重新编码为其他变量:旧值和新值】,将年龄划分为不同的范围,每个年龄段赋予一个新值,如50岁以上的人,在左下角【范围,从值到最高】下输入50,【新值】下输入4,点击【添加】,如图3-14,单击【继续】,返回原对话框,单击【确定】。进入‘数据视图’界面,生成一列变量‘AGE_GROUPS’,如图3-15.

3-13
图3-14
3-15

step3:单击【数据】 -【定义变量属性】,打开【 定义变量属性】对话框将‘AGE_GROUPS’变量移到【要扫描的变量】中,如图3-16,单击【继续】,在【标签】列中输入自定义标签,如图3-17。返回‘数据视图’,单击右上角标签转换按钮,变量值标签发生了改变,如图3-18.

图3-16
图3-17
图3-18

二、数据报表制作

(1)自定义表格形式

step1:单击【分析】 -【表】-【设定表】,进入【设定表格】对话框,依次将性别和年龄分组变量移到行,结果如图4-1,点击【类别位置】下的下拉菜单,选择【列中的行标签】(图4-2);再依次选中表中的‘AGE_GROUPS'和'SEX',单击鼠标右键,在弹出的子菜单中,见图4-3,取消【显示变量标签】前的勾选。点击【定义】下的【摘要与统计】,进入【摘要与统计】对话框,在该对话框中,将左侧【统计量】下的’列N%’和’行N%’移到右侧【显示】中。见图4-4,单击【应用选择】,返回【设定表格】对话框。

图4-1
图4-2
图4-3

step2:选中表中的‘AGE_GROUPS',点击【定义】下的【分类和总计】,进入【分类和总计】对话框,选中30~39岁标签,单击【添加小计】,在弹出的【定义小计】对话框中输入‘中青年’,将18~39岁的用户定义为中青年,同样方法,设置40~59岁的为中老年,见图4-4,单击【应用】,返回【设定表格】对话框,单击【确定】。

图4-4

(2)表格导出

step1:选中输出的表格,鼠标右键,在弹出的子菜单中选择【导出】,见图4-5,进入【导出输入】对话框,在左侧文档类型下拉子菜单中选择想要输出的文件类型,中间【浏览】选择文件保存位置,如图4-6,单击【确定】

图4-5
图4-6

(3)报表分析

图4-7

行N%数据体现了在不同年龄段下的男女人数比例:随着年龄段增大,女性占比逐渐降低。中青年群体中,男女占比基本持平,分别为49.5%和50.5%,而中老年群体,男性占比远高于女性,分别为62.2%和37.8%。列N%数据体现了在不同性别下,各年龄段的用户人数比例。男性用户中,人数占比由高到低的年龄段依次是30~39岁(43.2%),40~49岁(28.4%),18~29岁(15.3%)和50岁以上(13.1%)。而女性用户中,人数占比由高到低年龄段依次是30~39岁(48.5%),18~29岁(21.8%),40~49岁(20.9%)和50岁以上(8.8%)。 由此可见,女性用户相比男性用户总体更加趋向年轻,18~39岁的女性用户占了女性总用户的70%以上,而30~49岁的男性用户占了男性总用户的70%以上。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342