在研究变量y 与因子x1,x2,…,xm之间的函数关系y =f(x1,x2,…,xm)时,人们通常是通过一组观测数据yj,{xj1,xj2,…,xjm}(j =1,2,…,n)来寻求变量y 与因子x1,x2,…,xm之间的函数关系f。同时,由于观测数据总是带有观测误差,人们在考虑y与因子x1,x2,…,xm之间的关系时可能会忽略一些作用很小的未知因子,所以,人们一般用带有随机误差的模型
来刻化观测数据yj与{xj1,xj2,…,xjm}之间的关系。对于式(8.1)这种带有随机误差的模型,人们在一定的假设条件下,采用数理统计的方法来寻求函数关系f 的最优估计。
对于线性的函数关系f,式(8.1)称为线性模型,对它已经研究得比较透彻,有成熟的计算方法。例如,对于线性模型,式(8.1)表达为:
令z =y-a0,上式表达为:
当有一组观测数据zj,{xj1,xj2,…,xjm}(j =1,2,…,n)时,式(8.3)可写成矩阵形式:
其中(www.xing528.com)
可以采用最小二乘法估计参数θ,估计式为:
对于非线性的函数f,式(8.1)称为非线性模型,对它的研究则极为困难,特别是因子数较多的高维问题,除少数可以化为线性模型处理以外,绝大多数情况都难以直接分析。针对以上问题,统计学家提出了投影寻踪方法,它把高维数据投影到低维子空间上,寻找能反映出高维数据结构特征的投影,以达到分析高维数据的目的。设投影值为Z,则
式中:A为投影矩阵。于是研究Y 与X 的高维问题就变成了研究Y 与Z 之间的低维甚至一维问题了,这不仅可以使数据点较为集中,便于考察数据结构特征,而且可以在屏幕上作图,以便了解变量y 与因子投影之间的变化趋势,为我们提供了分析高维数据的有效方法。
投影寻踪方法包括线性投影、投影指标和最优投影方向三个基本概念。下面分别予以介绍。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。