首页 理论教育 青海省标准化羊场结构调查的因子分析结果

青海省标准化羊场结构调查的因子分析结果

时间:2023-07-24 理论教育 版权反馈
【摘要】:SAS 统计分析中可利用PROC FACTOR 过程对数据进行因子分析。(三)实例应用例11.4在青海省12 个地区标准化羊场进行关于羊场结构是否合理调查,有5 个调查指标,分别为羔羊数、6 岁以上羊只比例、可繁母羊总数、公羊总数和总羊只数,数据见表11.3,试做因子分析。从输出结果可知,各共性方差均超过90%,说明这4 个潜在的因子已经能够较好地反映各指标所包含的大部分信息。图11.20例11.4SAS 程序图②旋转后的因子载荷。

青海省标准化羊场结构调查的因子分析结果

近年来,随着计算机科学的发展,高速计算机已经运用到了生物科学的各个领域因子分析已广泛应用于医学、兽医学、生物学、心理学气象学动物科学等领域。因子分析是一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子,并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法。其基本思想是从分析多变量数据的相关关系入手,找到支配这种相关关系的少数几个相关独立的潜在因子,并通过建立起这些潜在因子与原变量之间的数量关系来预测潜在因子的状态,帮助发现隐藏在原变量之间的某种客观规律性。因子分析和主成分分析都能够起到厘清多个原始变量内在结构关系的作用,但主成分分析重在综合原始变量的信息,而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法。因此可说,因子分析是主成分分析的推广,也是一种把多个变量化为少数几个综合变量的多变量分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的关系。

对于一个问题可以综合运用多种统计方法进行分析,例如一个畜牧科学模型的建立,可先根据有关生物学、生态学原理,确定理论模型和实验设计,再根据试验结果,收集试验材料,对资料进行初步提炼,然后应用统计分析方法(如相关分析、逐步回归分析、主成分分析等)研究各个变量之间的相关性,选择最佳的变量子集合。并在此基础上构造模型,最后对模型进行诊断和优化处理后用于实际生产。SAS 统计分析中可利用PROC FACTOR 过程对数据进行因子分析。

PROC FACTOR 过程如下所述。

(一)格式调用

PROC FACTOR DATA= N= OUT= OUTSTAT= METHOD= ROTATE= MAXITER=RECORDER HEY 选项列表;

VAR 变量名列表;

PARTIAL 变量名列表。

(二)语句说明

(1)PROC FACTOR 选项

①DATA 语句指定要分析的数据集名及一些选项,它可以是原始SAS 数据集,也可以是CORR、COV、UCORR、UCOV 等矩阵

②N 用来确定潜在因子个数,该选项缺省时,系统会自动根据“特征值大于1”的原则确定潜在因子个数。

③OUT 选项用来保存原变量和因子得分变量,变量名为factor1,factor2 等,只有使用了N选项,OUT 选项才能起作用。

④OUTSTAT 选项指定输出结果的SAS 数据集名,该数据集保存的是每一个指标的均值、标准差、样本数、相关系数矩阵或方差协方差矩阵、特征值和特征向量、事前共性方差、事后共性方差、未旋转因子载荷、旋转线性变换、旋转后的因子载荷以及因子得分系数等。

⑤METHOD 选项用来确定因子分析的方法,可选用的有主成分分析法(PRIN)、最大似然分析法(ML)、主因子分析法(PRINIT)等,缺省时默认为PRIN 法。

⑥ROTATE 选项用来指定因子旋转的方法,可选用的最大方差旋转法(VARIMAX)、正交最大方差旋转法(ORTHOMAX)、相等最大方差旋转法(EQUAMAX)、比例最大方差旋转法(PROMAX)等,缺省时默认为NONE(不旋转)。

⑦MAXITER 选项给出最大迭代次数,缺省时默认为30。

⑧RECORDER 指令系统将指标变量按每一个潜在因子载荷的绝对值从大到小重新排序。

⑨HEY 表示大于1 的共性方差的值设定为1。

(2)VAR 选项

用于列出要分析的原始变量。如果该语句缺省,系统则分析其他语句中未涉及的所有指标变量。

(3)PARTIAL 语句

用于列出混杂变量,指定系统使用偏相关系数或偏方差、协方差来计算主成分。例如PARTIAL X,它表示偏相关系数或偏方差、协方差是以变量X 为混杂变量的,即所有的相关系数都表示的是在X 不变的情况下,两个变量之间的关联程度。但是,该语句列出的变量不能出现在VAR 语句中。

(三)实例应用

例11.4 在青海省12 个地区标准化羊场进行关于羊场结构是否合理调查,有5 个调查指标,分别为羔羊数(A)、6 岁以上羊只比例(B)、可繁母羊总数(C)、公羊总数(D)和总羊只数(E),数据见表11.3,试做因子分析。

表11.3 5 个调查指标数据表

SAS 程序如图11.15 所示。

图11.15 例11.4SAS 程序图(1)

结果输出为:(www.xing528.com)

1.旋转前的分析结果

①相关系数矩阵计算出来的全部特征值总共5 个,均值为1,即特征值、相邻两个特征值的差异,每个因子的贡献率和累计贡献率。在初始模型分析中,算出有两个特征根大于1,其和占总特征根之和的93.40%,即大约93.40%的总方差(5 指标变量的总变异)可以由两个潜在因子解释。

SAS 程序如图11.16 所示。

图11.16 例11.4SAS 程序图(2)

②所有指标变量在4 个因子上的因子载荷。通过所提供的因子载荷矩阵,可以看到因子1 在多数原始指标上都有较大的载荷;因子2 在A 指标上有较大的载荷,在B 指标和E 指标上有较大的负载荷,其余两个因子的意义不明显。

SAS 程序如图11.17 所示。

图11.17 例11.4SAS 程序图(3)

③每个因子所解释的方差,SAS 程序如图11.18 所示。

图11.18 例11.4SAS 程序图(4)

④最终共性方差,包括总体和每一个指标变量的最终共性方差。从输出结果可知,各共性方差均超过90%,说明这4 个潜在的因子已经能够较好地反映各指标所包含的大部分信息。但是从因子载荷上看,却很难看出每一个潜在因子主要支配哪些指标。

SAS 程序如图11.19 所示。

图11.19 例11.4SAS 程序图(5)

2.旋转后的分析结果

①坐标系旋转方法:4 次方最大旋转法,正交转换矩阵,SAS 程序如图11.20 所示。

图11.20 例11.4SAS 程序图(6)

②旋转后的因子载荷。通过最大方差正交旋转后,得到了5 个指标在4 个因子上的新的因子载荷。对旋转后的因子载荷矩阵进行分析,可以看出:因子1 在B、D 和E 等3 个指标上有较大的因子载荷,可能为基本羊场结构因子;因子2 在A、C 和D 指标上的载荷较大,反映了羊场的A 和C 与E 的对比值,可称为羊场潜力因子。

SAS 程序如图11.21 所示。

图11.21 例11.4SAS 程序图(7)

③旋转后每个因子所解释的方差,SAS 程序如图11.22 所示。

图11.22 例11.4SAS 程序图(8)

④为旋转后最终共性方差,包括总体和每一个指标变量的最终共性方差。各指标的共性方差均较为理想(均接近或超过90%),这说明4 个潜在因子已经能够较好地反映各指标所包含的大部分信息,SAS 程序如图11.23 所示。

图11.23 例11.4SAS 程序图(9)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈