描述性分析(Descriptives)主要用于描述连续变量统计量计算,也可将原始数据转换成标准Z分值(标准化数据)并存入数据集。同Frequencies分析相比,Descriptives分析不能计算百分位数外,其他与Frequencies分析相同。
例:对于资料中的年龄和APACHEⅢ评分进行简单描述性分析,数据如下:
-
打开 分析-描述统计-描述性分析
其中:
变量:列出需要分析的变量名
将标准化值另存为变量:选择该框,表示将变量列表中的每一个要分析描述的变量都要计算 Z 标准化,并另存为新变量
- 打开 选项
选项、离散、后验分布特征与Frequencies相同
- 显示顺序:
变量列表:按照变量框中的顺序显示结果
字母:按照字母顺序显示结果
按平均值升序排列:按均值从小到大排列、输出
按平均值降序排列:按均值从大到小排列、输出
- 输出结果与说明
描述性分析输出比较简单,仅一张表格。相应统计量在前面介绍过,在此不再重复。
由于选择了变量标准话,从数据窗口我们可看到新增加两个变量,即Z_Age/Az_APACHE,分别保存了Age和APACHE的标准化Z值。
- 语法
DESCRIPTIVES VARIABLES=Age APACHE
/SAVE
/STATISTICS=MEAN STDDEV MIN MAX.
注:数据标准化
在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种,常用的有“最小—最大标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。
(1)min-max标准化(Min-max normalization)/0-1标准化(0-1 normalization)
-
也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:
其中max为样本数据的最大值,min为样本数据的最小值。
(2)Z-score标准化
基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。其转换函数为:
新数据=(原数据-均值)/标准差
z-score标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。
(3)小数定标标准
- 这种方法通过移动数据的小数点位置来进行标准化。小数点移动多少位取决于属性A的取值中的最大绝对值。
- 将属性A的原始值x使用decimal scaling标准化到x'的计算方法是:
x'=x/(10^j)
其中,j是满足条件的最小整数。
例如 假定A的值由-986到917,A的最大绝对值为986,为使用小数定标标准化,我们用每个值除以1000(即,j=3),这样,-986被规范化为-0.986。