首页 理论教育 主成分分析和聚类分析及结果分析

主成分分析和聚类分析及结果分析

时间:2023-06-08 理论教育 版权反馈
【摘要】:在本研究的主成分分析评价中,使用R软件显示各指标数据的Z-score标准化值,并作聚类分析用以验证SPSS for Windows 13.0的主成分分析结果。从聚类的结果可以看出,与主成分分析各企业的得分及排名基本一致,从而可以验证主成分分析的结果。图6-1 R软件的聚类分析命令及结果显示

主成分分析和聚类分析及结果分析

一、R软件简介

R是一个开放的统计编程环境,是S语言的一种方言,同时也是一种软件,是集统计分析与图形直观显示于一体的统计分析软件。R最早是1995年由Auckland大学统计系的Robert Gentleman和Ross Ihaka编制的,目前由R核心开发小组进行维护工作。R软件的使用完全免费,可以运行于UNIX,Windows和Macintosh的操作系统上。R嵌入了一个非常实用的帮助系统,具有很强的作图能力,也可以自己编制函数来扩展现有的R语言,使它不断的升级和完善。

在本研究的主成分分析评价中,使用R软件显示各指标数据的Z-score标准化值,并作聚类分析用以验证SPSS for Windows 13.0的主成分分析结果。

二、主成分分析及结果

具体分析步骤如下:

第一,对原始数据进行标准化处理。用R软件对各指标值进行标准化处理,软件命令及指标值标准化结果如表6-11所示。

第二,对指标进行描述统计,建立数据间的相关系数矩阵。各指标的描述统计结果见表6-12,相关系数矩阵见表6-13。

第三,提取主成分,确定主成分个数。方差分解主成分提取分析表及其初始因子载荷矩阵分别列于表6-14、表6-15和表6-16。从结果可知,抽取了五个主成分,即m=5。

从因子载荷矩阵进一步分析可知,消化吸收能力、信息采集能力、自由创新意识、界面管理文化、界面关系处理和界面管理激励机制各指标在第一主成分(F1)上有较高载荷,说明第一主成分基本反映了这些指标的信息,可以将第一主成分命名为信息处理与界面关系;第二主成分(F2)基本反映了研发经费投入强度、研发人员投入强度、生产设备装备水平、界面管理协调机制和界面管理战略规划这些指标的信息,命名为研发投入与界面协调;第三主成分(F3)基本反映了工艺设计水平及创新集成度、生产设备新度、营销投入强度这三个方面的指标,命名为工艺水平与营销能力;创新产品率和拥有发明专利数两个指标在第四主成分(F4)上的载荷较大,可以将第四主成分命名为创新水平与创新效果;第五主成分(F5)则主要反映了技术工人素质,命名为技术工人素质。

表6-12 各指标值的描述统计分析

表6-14 变量的共同度

Extraction Method:Principal Component Analysis.

表6-16 初始因子载荷矩阵

Extraction Method:Principal Component Analysis.

a.5components extracted.

第四,用载荷矩阵中的数据除以主成分相对应的特征值的平方根可以得到五个主成分中每个指标所对应的系数,即特征向量Ai。五个主成分的特征向量如表6-17所示。将得到的特征向量与标准化后的数据相乘,就可以得出主成分分析的数学模型。如下:(www.xing528.com)

应用这一线性组合计算出各主成分分值,最后利用综合主成分函数:

F=0.439 68·F1+0.152 34·F2+0.104 57·F3+0.071 67·F4+0.052 23·F5

表6-17 五个主成分的特征向量

续 表

可以求得各个企业技术创新中界面管理效果的综合主成分值。

经计算,15家企业的各个主成分评价值和综合主成分值见表6-18。

三、聚类分析及结果

选择离差平方和法,运用欧氏平方距离进行系统聚类分析,利用R软件,其命令及分析结果如图6-11所示。根据图6-11可以把15家企业按其技术创新界面整合管理效果的高低分为5类,即:

第一类企业界面整合管理效果最好:10号企业;

第二类企业界面整合管理效果较好:11,12,14,15号企业;

第三类企业界面整合管理效果一般:2,5,6,7号企业;

第四类企业界面整合管理效果较差:1,13号企业;

第五类企业界面整合管理效果最差:3,4,8,9号企业。

从聚类的结果可以看出,与主成分分析各企业的得分及排名基本一致,从而可以验证主成分分析的结果。

图6-1 R软件的聚类分析命令及结果显示

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈