首页 理论教育 多元统计分析中的因子分析简介

多元统计分析中的因子分析简介

时间:2023-10-30 理论教育 版权反馈
【摘要】:本章主要介绍针对指标的R型因子分析。这种线性旋转方法称为因子轴的正交旋转,是因子分析中最为常用的旋转方法。

多元统计分析中的因子分析简介

8.2.1.1 因子分析基本原理

前述章节运用主成分分析、回归分析等方法分析了可测量变量间的维度。但在科学研究中,许多特征往往无法测量,例如智力,这时主成分分析、回归分析等针对可测量变量的统计方法就失去了用武之地。我们将无法测量的变量称之为潜在因子,它虽然无法被直接观测,但是我们可以通过某些与潜在因子有关的可测量变量来反映该潜在变量。例如,由于表达能力、理解能力、记忆能力等往往与智力有关,因此我们可以通过它们间接反映智力水平。因子分析是分析潜在因子的有效方法,其基本思想是根据相关性大小将变量分组,使同组内变量的相关性尽可能高,不同组变量相关性尽可能低。因此,因子分析需要在所有变量中提取几个不可观测且互不相关的共同特征,即公共因子(common factor),使其能够与特殊因子构成的线性方程代表某个待研究的潜变量。根据因子分析是对指标还是样本进行处理,我们将其分为R型因子分析和Q型因子分析。本章主要介绍针对指标的R型因子分析。

根据潜在因子是否已知,因子分析法可分为两类:一类是探索性因子分析,另一类是验证性因子分析。我们通常所说的因子分析就是探索性因子分析,它主要应用在数据分析的初级阶段,用于探讨可观测变量的特征、性质及内部的关联性,从而更深入揭示与这些观测变量有关的潜在因子。它要求潜在因子之间相互独立,并且能表达原可观测变量的绝大部分信息。验证性因子分析在探索性因子分析的基础上进行,当已经知道哪些潜在因子能影响可测变量时,需要进一步明确潜在因子对可测变量的影响程度,以及这些潜在因子之间的关联程度,则可进行验证性因子分析。验证性因子分析不要求潜在因子之间相互独立,相反,其目的是确定潜在因子与观测变量之间的关联性,它是将多个指标之间的关联性简化为较少的几个潜在因子之间的关联,并对分析结果进行统计检验,验证性因子分析也是结构方程模型分析重要组成部分。

8.2.1.2 因子分析的数学模型

因子分析的出发点提取原变量的大部分信息,用少数公因子代表不可观测的潜在变量。一般的,假设有X1,X2,X3,…,Xp个标准化后的变量,假设这p个变量中有m个因子F1,F2,…,Fm可以对这p个变量进行描述,则用数学模型来表示为:

在公式(8-10)中,由于F与每个变量都相关,于是称F为每个变量的公共因子或共因子。e1,e2,…,ep分别只与X1,X2,X3,…,Xp有关,称为X1,X2,X3,…,Xp的特殊因子(special factor)。

在上式中,令:

则上面的公式可被写成如下的矩阵形式:

式中,ep是均值为0、方差为1的随机变量;e1,e2,…,ep互不相关,且方差不同;F与e相互独立;F1,F2,…,Fm不相关,均值为0且方差为1(汪海波,2013)。下面将介绍五个相关概念。

(1)因子载荷。aij为Xp与Fm协方差。由于Xp为标准化系数,因子载荷aij为第i个变量与第j个公共因子的相关系数,反映了第i个变量在第j个公共因子的相对重要性。(www.xing528.com)

(2)变量共同度。变量共同度也称为公共方差,反映全部公共因子对原有变量xi总方差的解释比例。原有变量xi的共同度为因子载荷矩阵A中第i行元素的平方和,即:

越接近1(原有变量xi标准化后的总方差为1),说明公共因子解释原有变量的信息越多。

(3)公共因子Fj的方差贡献。共同度是考虑所有公共因子与某一变量的关系,而公共因子Fj的方差贡献定义为因子载荷矩阵A中第j列各元素的平方和,即:

可见,公共因子Fj的方差贡献反映了因子Fj对所有可观测变量总方差的解释能力,其值越高,说明因子的重要程度越高。

(4)因子旋转。进行因子分析的目的不仅仅是要确定公共因子和因子载荷,更重要的是要对公因子的实际意义进行解释。确定公因子的实际意义往往根据某个潜在因子的因子载荷的大小,当因子载荷大于0.5,就认为潜在因子能在很大程度上支配和解释该指标变量。但在多数情况下,各公共因子对指标变量的作用往往较为均匀,因子载荷并不是很突出,这容易导致公共因子的实际意义难以解释。通过因子旋转,我们可以很好地解决这个问题,即通过某种线性变换使因子载荷的绝对值更接近0或更接近1。由于因子分析的解不是唯一的,如果求得的因子载荷A不甚理想,可以右乘一个正交阵T,使得AT能有更好的实际意义。这种线性旋转方法称为因子轴的正交旋转,是因子分析中最为常用的旋转方法。正交旋转有以下两个性质:一是保持指标的共性方差不改变;二是旋转后公因子依然相互独立。常用的正交旋转法有最大方差法、均方最大旋转、四次方最大旋转等。除了正交旋转外,有时还可以进行斜交旋转。因为斜交旋转不能保证各公共因子相互独立,且因子载荷的解释也较为复杂,在实际研究中应用较少,但它能加大因子载荷平方,使取得的旋转效果比正交旋转效果更好。

(5)因子得分。因子得分是指各潜在因子取值情况,它的数值能够通过可测变量的计算获得,计算公式如下:

公式(8-14)中,各观测变量的函数是公共因子的函数,称之为因子得分函数。只需将p个变量的数值代入便可求出相应的Fj。估计因子得分的方法较多,常用的估计方法有Bartlett法、回归估计法等。建立因子分析模型后,可以通过因子得分对样本进行综合评价,如确定各省医疗卫生情况的总和排名等,进一步通过因子得分计算综合得分,计算公式为:

wm为旋转后或旋转前的方差贡献率

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈