层次聚类分析中的 Q型聚类可使得具有共同特点的样本聚齐在一起,以便对不同类的样本进行分析。
样本数据间的亲疏程度主要通过样本间的距离、样本间的相关系数来度量。
案例
对某班8名学生的语文成绩进行聚类,聚类的依据是入学语文成绩和第一次考试的语文成绩。
原始数据
数据分析
执行:analyze/classify/hierarchical cluster,得到如下图的结果(需要在method 中选择“plots”构建,系统树图):
由上述的聚类结果表明:在这8位同学中,第一次系统就将刘关(6)和五五(5)聚在了一起,将王梅(7)和李四(3)聚在了一起,这是没有错的,这两组的成绩变化都不大,距离在5以内;二次聚类的时候,将4,5,6聚在了一起(包含3与7),这些的相同之处在于入学成绩普遍低于语文成绩,平均分在6分左右,距离在5以内;第三次聚类2,4,6(包括之前)聚在了一起,与上述原因一样,只不过平均分在8分左右,距离依然在5以内;第四次聚类将4,6,5,7,3聚在了一块(之前组都包含,重新组合而已),距离在15以内,数据明显已经不突出了,因此,到这就可以进行分析了。如果需要其他的数据,还可以对每个人进行描述性分析或者交叉分析,作为辅助分析内容。
本编学习内容数据和案例均来自于清华大学出版社·倪雪梅·《精通spss统计分析》