首页 理论教育 主成分分析法简介及在数学实验中的应用

主成分分析法简介及在数学实验中的应用

时间:2023-11-02 理论教育 版权反馈
【摘要】:主成分分析法是在降维思想指导下,设法将原来的变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中选取出几个较少的、发挥主要作用的变量,利用这些变量尽可能多地反映原来变量间信息的统计方法。主成分分析法的作用主要体现在降维,可以通过确定主成分个数降低所研究数据空间的维数,弄清变量间的某些关系;还可以利用主成分分析筛选回归变量,构造回归模型,对原始数据进行新的回归分析。

主成分分析法简介及在数学实验中的应用

主成分分析法是在降维思想指导下,设法将原来的变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中选取出几个较少的、发挥主要作用的变量,利用这些变量尽可能多地反映原来变量间信息的统计方法。主成分分析法的应用领域极其广泛,如:食品开发与研究、人口统计、数量地理、产品评估及分子动力学模拟等领域。

建立主成分分析模型的一般步骤为:

1.根据原始数据采集p维随机向量x=(x 1,x 2,…,x p)′的n个样品矩阵X(n>p),即

其中,

2.计算样本均值)和协方差矩阵Z;

3.求解特征方程,其中I p为p维单位矩阵,将得到的p个特征值按照从大到小顺序排列为λ1≥λ2≥…≥λp

4.计算特征值λi相应的单位特征向量i=1,2,…,p;(www.xing528.com)

5.考虑到样本数据间信息的累计贡献率需要超过85%,因而确定主成分的个数m时,应使得累计贡献率不小于85%,即

记相应的第i个成分贡献率为:

6.写出第i个主成分的表达式为:

注 第一个主成分F 1是m个主成分中方差最大,包含信息量最多的主成分,而且所有主成分之间是线性无关的。

主成分分析法的作用主要体现在降维,可以通过确定主成分个数降低所研究数据空间的维数,弄清变量间的某些关系;还可以利用主成分分析筛选回归变量,构造回归模型,对原始数据进行新的回归分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈