首页 理论教育 基本思想与几何意义-实用数学方法的重要内容

基本思想与几何意义-实用数学方法的重要内容

时间:2023-11-17 理论教育 版权反馈
【摘要】:对只有两个变量X 1,X2的观测值,如果X 1,X2分别代表平面坐标系的横轴和纵轴,每个观测值都有相应于这两个坐标轴的坐标值,也就是每个观测值是平面中的一个点。如果这些数据点形成一个如图8.10的椭圆形轮廓的点阵,那么这个椭圆有一个长轴和一个短轴,称为主轴。把高维椭球的各个主轴找出来,再选出几个主轴作为原始变量的代表,这样,主成分分析就基本完成了。图8.3.1二维空间主成分分析的几何意义

基本思想与几何意义-实用数学方法的重要内容

为了方便理解,我们仅在二维空间里讨论主成分的几何意义,多维变量的情况和二维类似,二维空间的结论可以扩展到多维的情况。

对只有两个变量X 1,X2的观测值,如果X 1,X2分别代表平面坐标系的横轴和纵轴,每个观测值都有相应于这两个坐标轴的坐标值,也就是每个观测值是平面(二维坐标系)中的一个点(每个观测值可以看成是空间中的一个点,包括高维的)。如果这些数据点形成一个如图8.10的椭圆形轮廓的点阵,那么这个椭圆有一个长轴和一个短轴,称为主轴。椭圆的主轴之间是互相垂直的,主轴的大小体现了数据在主轴方向的变化大小。当坐标轴和椭圆的长短轴平行,那么代表长轴的变量描述了数据的主要变化,而代表短轴的变量描述了数据的次要变化。通常,坐标轴和椭圆的长短轴不平行,如夹角θ,这时,我们考虑对原始变量进行线性变换,即将坐标系逆时针旋转θ角度,新的坐标轴则为Y1和Y2

经过这样的线性变换后,新变量是原始变量的线性组合,新变量和椭圆的长短轴平行。如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的两个变量(舍去次要的短轴变量),降维就完成了。在极端的情况,如果短轴退化成一点(如图8.3.1(b)),则长轴变量能够完全解释这些数据点的变化,由二维到一维的降维就自然完成了。椭圆的长短轴相差越大,降维也越有道理。(www.xing528.com)

和二维类似,三维变量对应有三维空间椭球,高维变量对应有高维空间椭球,椭球的主轴也是互相垂直的(也叫正交,相互间线性无关),是原始变量的线性组合,叫作主成分(Principal Component)。把高维椭球的各个主轴找出来,再选出几个主轴作为原始变量的代表,这样,主成分分析就基本完成了。正如二维椭圆有两个主轴、三维椭球有三个主轴一样,有几个变量,就对应有几个主成分。

图8.3.1 二维空间主成分分析的几何意义(右边是极端情况下的)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈