首页 理论教育 主成分分析的原理及应用

主成分分析的原理及应用

时间:2023-06-30 理论教育 版权反馈
【摘要】:主成分分析也称为K-L变换,是在统计特征基础上的多维正交线性变换,是最常用的一种遥感数字图像处理变换算法。通过主成分分析技术可以把原来多个指标化为少数几个相互独立的综合指标,处理波段间高度相关的数据时非常有用。主成分分析的原理如图12-1所示。

主成分分析的原理及应用

主成分分析也称为K-L变换,是在统计特征基础上的多维正交线性变换,是最常用的一种遥感数字图像处理变换算法

通过主成分分析技术可以把原来多个指标化为少数几个相互独立的综合指标,处理波段间高度相关的数据时非常有用。对于、幅多波段的图像,其不同的波段之间往往存在着很高的相关性,这就意味着有相当一部分数据是冗余的。通过主成分变换就能把原来各波段中的有用信息集中到个数尽可能少的新的主成分图像中,而且新的图像的主成分之间互不相关,能够各自包含不同的地物信息,同时原始图像信息量的损失最小。主成分分析的原理如图12-1所示。原始特征向量的方向指向特征空间中集群分布的结构轴方向(p,q),主成分变换的几何意义是把原始特征空间的特征轴x旋转到平行于集群分布的结构轴方向上去,得到新的特征轴y。从图12-1中可知,y1特征对应的样本特征值为A1,而y2对应的样本特征值为A2。当A2远小于A1时,y2特征便可舍去,只用y1来表示原始集群的有效信息。

图12-1 主成分变换

主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵

如果p是一个较大的值的话,就会涉及大量的特征数据,要想通过分析p维数据来抓住地理事物的内在规律是很困难的。为了克服这一困难,就需要进行降维处理,运用较少的几个综合指标来代替原来较多的变量指标,同时使得这些较少的综合指标能尽量多地反映原来较多指标所反映的信息,还要保证它们之间彼此独立。这些综合指标(即新变量)应如何选取呢?最简单的形式就是取原来变量指标的线性组合,恰当调整组合系数,使新的变量指标代表性最好且相互独立。(www.xing528.com)

设定原来的变量指标为x1,x2,…,xp它们的新综合指标为z1,z2,z3,…,zm(m≤p)。则

在式(12-2)中,系数lij由下列原则来决定:

(1)zi与zj(i≠j;i,j=1,2,…,m)之间彼此相互无关;

(2)z1是x1,x2,…,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,…,xp的所有线性组合中方差次大者……zm是与z1,z2,…,zm都不相关的x1,x2,…,xp的所有线性组合中方差最小者。

这样决定的新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xp的第一、第二…第m主成分。其中,z1在总方差中所占的比例最大,z2,z3,…,zm的方差依次递减。在解决实际问题时,常挑选前几个最大的主成分,这样既可以减少变量的数目,又可以抓住主要矛盾,从而简化了变量之间的关系。

根据以上分析可以看出,找主成分就是确定原来变量xj(j=1,2,…,p)在zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p),它们分别是x1,x2,…,xp相关矩阵的m个较大的特征值所对应的特征向量。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈