【摘要】:(一)PP模型简介[14~28]投影寻踪是一种可用于高维数据分析,既可作探索性分析,又可作确定性分析的方法。因为PP方法可以将高维数据投影到一维子空间上,再对投影后的一维数据进行分析,比较不同一维投影的分析结果,找出好的投影;PP方法与其他非参数方法一样可以用来解决某种非线性问题。
(一)PP模型简介[14~28]
投影寻踪是一种可用于高维数据分析,既可作探索性分析,又可作确定性分析的方法。Friedman和Tukey(1974)模仿有经验的数据分析工作者的做法,提出了一种把整体上散布程度和局部的凝聚程度结合起来的新指标来作聚类和分类分析。PP方法的特点,主要可以归纳为以下几点:
(1)自然科学中有许多数据不符合正态分布或人们对数据没有多少先验信息,需要从数据本身找出其结构或特征。PP方法能成功的克服高维数据的“维数祸根”所带来的严重困难,这是因为它对数据的分析是在低维子空间上进行的,对1~3 维的投影空间来说数据点就足够密了,足以发现数据在投影空间中的结构或特征;
(2)PP方法可以排除与数据结构和特征无关的或关系很小的变量的干扰;
(3)PP方法为使用一维统计方法解决高维问题开辟了途径。因为PP方法可以将高维数据投影到一维子空间上,再对投影后的一维数据进行分析,比较不同一维投影的分析结果,找出好的投影;(www.xing528.com)
(4)PP方法与其他非参数方法一样可以用来解决某种非线性问题。PP问题虽然是以数据的线性投影为基础,但它找的是线性投影中的非线性结构,因此它可以用来解决一定程度的非线性问题,如多元非线性回归。
(二)PPC模型建模步骤
式中:xmax(j)、xmin(j)分别为第j 个指标值的最大值和最小值,x(i,j)为指标特征值归一化的序列。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。