因子分析法(factor analysis)是多元统计分析的一个重要分支,其主要作用是用几个少数不可观测的变量来概括原始多个可观测的变量的主要信息,以便达到降低变量个数、浓缩数据的目的。因子分析模型的出发点是用少数的相互独立的因子变量来代替原有多个变量的绝大部分信息。
因子分析法有许多确定因子变量的方法,最常用的几种方法有主成分分析法、主轴因子法、极大似然法、最小二乘法等。主成分分析法的原理是重新建立原始变量的结构,按照事先确立的原则筛选出因子变量;而主轴因子法、极大似然法和最小二乘法的原理相同,都是试图通过分析原始变量的方差筛选因子变量。
因子分析法的主要步骤如下:
(1)原始数据标准化处理。由于数据具有不同的量纲,在进行分析之前必须对原始数据进行无量纲化处理,消除其对分析结果的影响。
(2)相关性检验。因子分析法的基本原理是从多个变量中提取共同因子,所以必须保证各原始变量之间必须有相关性,否则各个变量之间没有共享信息,就不应当有共同因子提取。统计学上,一般使用KMO测度和Bartlett(巴特利特)球体检验两种检验方法。
KMO测度的主要目的是用于比较观测值的相关系数和偏相关系数两者大小。当所有原始变量之间的偏相关系数平方和比相关系数平方和小时,KMO测度值小,表明所有原始变量之间的相关性不能被其他变量解释,因子分析结果不好;当偏相关系数平方和比相关系数平方和大时,KMO测度值大,表明变量之间相关性被其他变量解释程度较大,因子分析结果较好。根据大量实践应用经验,KMO的经验值如表8-1所示。
表8-1 KMO的经验值(www.xing528.com)
Bartlett球体检验的目的是检验原始变量之间相互独立的假设,即相关系数矩阵是否是单位矩阵。单位矩阵中,斜对角线上的所有元素均为1,其他元素均为0。Bartlett球体检验的统计量通过相关矩阵行列式的卡方转换求得。该统计量取值最大时,拒绝原假设;如果统计量小,则不拒绝原假设,表明各变量相互独立,不适合因子分析。
(3)确定因子分析的方法。该方法主要有两种:主成分分析和公因子分析。其区别在于估算权重的方法不同。主成分分析将全部方差引入因子矩阵,且相关系数矩阵的斜对角线所有元素均为1,目的是用尽量少的变量解释尽量多的变量;公因子分析的相关系数矩阵的斜对角线由公因子方差组成,主要目的是识别公因子的主要维度。
(4)确定因子数。主要通过特征值、碎石图、解释方差百分比、复本信度和显著性检验几种常用方法确定。假设F1、F2、F3、…、Fp为新确定的因子变量,如果其中的前m个因子变量能够包含的原始变量信息量大于80%,即累计方差贡献率大于80%,则可以取m个因子变量综合反映原始变量指标体系。
(5)因子模型旋转。利用因子提取法提取的因子虽然表示了因子与变量之间的关系,并且保证了因子之间的正交性,即因子之间不相关。但通常情况下,因子对变量的解释能力较弱,有必要进行因子模型旋转,使公共因子的负荷系数更接近于0或1。
(6)计算因子综合得分。利用因子表示原始变量,需要知道因子和原始变量之间的线性关系。计算因子综合得分的方法主要有回归分析法、巴特利特法和安德森-鲁宾(Ander-son-Rubin)法等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。