,选出优质的客户
1.概念
因子分析是通过研究变量的相关系数的矩阵,把这些变量间错综复杂的关系鬼结成扫数几个总和因子,并据此对变量进行分类的一种统计分析方法。由于归结出的因子个数少于原始变量的个数,但是他们有包含原始变量的信息,所以,这一分析过程也称为降维
2.主要目的
探索结构:在变量之间存在高度相关性的视乎我们希望用较少的因子去概括其信息
简化数据:把原始因子转换成一种你在粉刺后,使用因子得分进行其他分析,比如聚类分析,回归分析。
综合评价:通过每个音字得分计算出总和的得分,对分析队形进行总和评价
(原始变量会长换成新的依着你,因子之间相关新比较低,而依着你内部的变量相关程度较高)
3.几个概念:
1.因子载荷(factor loading)
因子载荷就是每个原始变量和每个因子之间的相关系数,它反映了变量对因子的重要性。通过因子载荷值的高低,可以知道变量在对因子中的重要性大小,这样能够发现银子的实际含义,有利于因子的命名
2.变量共同度(communality)
变量共同度就是每个变量所包含的信息能够被因子所揭示的程度,其取值范围介于0和1的之间,取值越大,说明该变量能被因子解释的程度越高
3.因子旋转(Rotation)
因子分析的结果需要每个因子都要实际的意义,有时原始变量和因子之间的相关关系可能是原始变量和因子之间表达出因子的含义,为了是这些先关系数就更加显著,可以对因子载荷矩阵进行旋转,是原始变量和因子之间的关系更为突出,从而对因子的解释就更加容易
4.因子得分(Factor Score)
因子得分可以使用来评价每个个案在每个因子上的分析的分值,而因子得分只能通过原始变量和因子之间关系计算得到,并且因子二分是经过标准化之后的数值,各个一字得分作为自变量,与对应的变量进行回归
注意:原始变量的数值是可以直接观测到的,而因子得分只能通过原始变量和因子之间的关系计算得到,并且因子得分是经过标准化之后的数值,各个因子得分之间不shou量纲的影响
4.因子分析的步骤
1.判断数据是否适合适合因子分析
因子分析的变量需求是连续变量,分类变量不适合直接进行因子分析;
建一个个案个数为变量个数的5倍以上,这只是参考依据,并不是绝对的标准
KMO检验统计量砸死0.5以下,就不适合因子分析,在0.7以上时,数据较适合因子分析,在0.8以上时,说明数据及其适合因子分析
2.构造因子变量
3.利用因子旋转方法是的因子更具有实际的意义
4.计算每个个案因子得分