首页 理论教育 基于因子分析和聚类分析的检验方法优化

基于因子分析和聚类分析的检验方法优化

时间:2023-06-11 理论教育 版权反馈
【摘要】:首先运用因子分析对全国31个省域的电子商务发展水平有关指标进行分析。这样就消除各指标因不同量纲对因子分析的结果影响。分析结果见表5-4.表5-4KMO和Bartlett的检验KMO=0.803>0.8,较适合做因子分析,Bartlett球形检验的Sig=0.000,Bartlett检验的拒绝原假设,认为各个变量之间不是独立的,适合做因子分析。进一步分析中国经济发展与电子商务水平的关系。

基于因子分析和聚类分析的检验方法优化

首先运用因子分析对全国31个省域的电子商务发展水平有关指标进行分析。将各单变量原始数据用Z-Scores法标准化处理,其中和σ是指标xi的均值和标准差。经标准化后,指标的均值为0,方差为1。这样就消除各指标因不同量纲对因子分析的结果影响。然后计算样本协方差矩阵S=(rij)31*31,并求协方差矩阵的特征根λ及单位特征向量T。特征根λ依大小次序排列,然后求相应主成份的特征根λ的贡献率和累积贡献率。利用SPSS对全国各省域电子商务发展水平进行因子分析,提取特征值大于1的公因子,公因子描述原变量总方差越大越好。

首先对上述指标进行KMO和Bartlett的球形度检验,分析上述数据是否适合进行因子分析。分析结果见表5-4.

表5-4 KMO和Bartlett的检验

KMO=0.803>0.8,较适合做因子分析,Bartlett球形检验的Sig=0.000,Bartlett检验的拒绝原假设,认为各个变量之间不是独立的,适合做因子分析。

提取公因子,对我国31个省级行政区的2012年10个电子商务指标进行提取主成份,如表5-5,提取的2个公因子描述原变量总方差的88.010%,可以认为这2个因子基本反映了原变量的绝大部分信息。

表5-5 解释的总方差

提取方法:主成份分析。

对2012年的中国31个省域的电子商务水平影响因子进行主成份提取。

表5-6 成份矩阵

提取方法:主成份法

从表5-6的主成份矩阵可知,因子1在Z域名数、Z第三产业、Z网站数、Z互联网宽带方面载荷较大,这一因子主要反映了电子商务宏观和中观的环境因素。因子2在Z移动电话、Z网站数量和Z互联网普及率方面载荷较大,代表了微观电子商务应用因子。主成份法验证了电子商务水平存在着宏观和微观水平的差异。(www.xing528.com)

根据因子得分系数矩阵将因子1(F1)、因子2(F2)得分进一步用各因素表示如下:

F1=0.115*Z计算机+0.113*Z互联网普及率+0.101*Z移动电话+0.116*Z互联网上网人数+0.137*Z域名数+0.135*Z网站数+0.103*Z网页数+0.119*Z互联网宽带接入端口+0.119*Z互联网宽带+0.132*Z第三产业

F2=0.117*Z计算机+0.260*Z互联网普及率+0.311*Z移动电话-0.287*Z互联网上网人数+0.055*Z域名数+0.104*Z网站数+0.233*Z网页数-0.274*Z互联网宽带接入端口-0.271*互联网宽带-0.164*Z第三产业

为了考察各地区的电子商务发展水平状况,并对其进行量化分析和综合评价,采用回归法求出因子得分函数,计算出两个因子的得分。两个因子分别从不同的方面反映了中国各省域的电子商务发展状况的总水平,但单独使某一公因子并不能对各地区的地位做出综合的评价,因此按各公因子对应的方差贡献率为权数计算如下综合统计量:

F1i和F2i的系数为各因子的贡献率,它是各因子的方差贡献率与k两个主因子的累计贡献率的比值。由解释的总方差表可知,λ1,λ2 分别为0.4527和0.4274(表5-4),将其代入(3)式,则各地区电子商务水平综合得分为:

经总方差加权后的Zi为各地区的电子商务水平综合得分,F1i,F2i为各地区的因子得分,i表示各区(省、市、区),综合得分值高,表明该地区电子商务水平高。由于在初时数据时进行了标准化,综合得分可为负,但并不表示电子商务水平为负,而是表明其综合水平低于平均水平。表5-7通过公式(3)和(4)计算的综合得分以及电子商务水平综合得分排名。为进一步探索电子商务水平与经济发展水平的关系,在表5-7中引入了中国各省域GDP排名(2013),以比较电子商务综合得分与GDP的关系。进一步分析中国经济发展与电子商务水平的关系。

表5-7 电子商务综合得分及排名和GDP排名比较

注:GDP数据来源中国社会经济统计数据库,F1是指因子1;F2是指因子2。

从综合得分(表5-7)来看,广东、北京、浙江、江苏等电子商务发展水平高,宁夏、甘肃和西藏等电子商务发展水平较低。值得注意的是四川、湖北其因子1(F1)得分为正,而因子2(F2)得分为负,表明这两省电子商务环境与应用水平存在着一定的分化,F1为正值表明这两省的电子商务环境因素高于平均水平,但F2得分为负表明电子商务微观运用水平低于平均水平,出现电子商务宏观环境与微观运用背驰。与GDP排名相比,电子商务水平与经济发展水平有一定的相关性,但并不完全相关。即电子商务水平与较高的水平相关,但经济发展水平与电子商务水平又不完全一致。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈