主成分分析也称主分量分析,是利用降低工作量的主旨思想,把多变量转化为少数几个综合变量。在实际问题研究中,为了全面、系统地分析问题,人们必须考虑众多影响因素。每个变量都不同程度地反映了所研究问题的某些信息,并且指标之间有一定的相关性。在统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,因而人们往往希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
在大部分动物科学研究实际问题中,变量之间是有一定的相关性的。科研工作者希望找到少数几个彼此不相关的综合指标来尽可能多地反映原来众多变量的信息。比如在描述牦牛生长发育指标中,体高、体长和体重这3 项指标可能是相关的,而胸围、管围和胸宽这3 个围度指标也会有一定的相关性。如果分别用每一个指标对牦牛生长发育作出评价,那么这种评价就是孤立、片面的,而不是综合的。仅选用几个“重要的”或“有代表性”的指标来评价,就可能失去许多有用的信息,容易得出片面的结论。所以人们需要一种综合性的分析方法,既可减少指标变量的个数,又尽量不损失原指标变量所包含的信息,对资料进行全面的综合分析。主成分分析(Principal Components Analysis)正是为适应这一要求而产生的,是解决这类问题的理想工具。
主成分分析就是研究如何将多指标问题转化为较少的新指标的问题,并且这些新的指标既是彼此互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。综合后的新指标就称为原来指标的主成分或主分量。(www.xing528.com)
主成分分析的主要用途就是通过分析,找出结构简单、相互独立的少数几个综合指标来解释原指标间的复杂关系以及原指标所反映的研究对象的特征,并在一定程度上可用于样品的分类。同时,在对多个自变量进行主成分分析的基础上,再对因变量和主成分之间作线性回归分析,即所谓的主成分回归,再把各主成分用原自变量的线性组合代入回归方程,就可以得出因变量与原多个自变量的回归方程。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。