首页 理论教育 现代中长期水文预报方法及应用:投影寻踪研究的主要内容及特点

现代中长期水文预报方法及应用:投影寻踪研究的主要内容及特点

时间:2023-10-04 理论教育 版权反馈
【摘要】:投影寻踪方法最早是在20世纪60年代末70 年代初为了研究数据的聚类结构而提出的。至此,初步建立了投影寻踪在统计学中的独立体系,大大推动了该方法的深入研究和实际应用。从投影寻踪的理论与应用研究来看,主要涉及投影寻踪回归、投影寻踪聚类分析以及投影寻踪学习网络等三方面的内容。投影寻踪方法能够有效克服高维数据的“维数祸根”所带来的严重困难。

现代中长期水文预报方法及应用:投影寻踪研究的主要内容及特点

投影寻踪方法最早是在20世纪60年代末70 年代初为了研究数据的聚类结构而提出的。在近十年的时间里国外很多研究者作了大量的理论研究,为投影寻踪方法的应用研究打下了基础。1995 年,应《The Annals of Statistics》杂志的邀稿,Huber发表了关于投影寻踪的综合性学术论文,并附有从事这一研究的理论工作者的讨论文章。至此,初步建立了投影寻踪在统计学中的独立体系,大大推动了该方法的深入研究和实际应用。从投影寻踪的理论与应用研究来看,主要涉及投影寻踪回归、投影寻踪聚类分析以及投影寻踪学习网络等三方面的内容。

(1)投影寻踪回归。由于投影寻踪方法在处理高维数据方面具有很大的优势,Friedman很早就将投影寻踪方法引入多元回归分析,建立了一种广义多元回归分析方法,在一定程度上克服了“维数祸根”的问题,取得了相当满意的预测效果。投影寻踪方法起点高,思路新颖,较之常规多元分析方法表现出一定优势,可以解决参数估计时的高维问题。李祚泳将投影寻踪回归方法成功应用于环境预测及环境影响因子的污染作用分析等方面;杨力行在前人研究的基础上,根据投影寻踪回归思想研制了投影寻踪回归分析软件包,在预测、优化领域取得了丰硕成果。

(2)投影寻踪聚类分析。1970年,Switzer在对牙买加化石数据进行分类时,提出了投影寻踪聚类设想。在以后的几十年里,投影寻踪聚类方法的研究非常活跃,它被广泛应用于模式识别领域,其基本思路是利用投影寻踪压缩和提取系统的高维特征量后,对系统模式进行识别。投影寻踪聚类分析为多元数据分析方法的实践提供了一种新的思路,取得了优于传统方法的良好效果。

(3)投影寻踪学习网络。投影寻踪方法的出现,引起了国外许多领域学者的重视。在Barron倡导的统计学习网络思想影响下,许多研究神经网络的学者将投影寻踪回归思想引入网络学习中,改变了前馈神经网络中常用的BP算法以及神经元函数形式,提出了基于投影寻踪回归学习策略的投影寻踪学习网络(Projection Pursuit Learning Network,即PPLN),其实质是一种更广泛意义上的网络回归模型。

投影寻踪的基本思想是把高维数据投影到低维子空间上,以便寻找出能反映高维数据结构或特征的投影,以达到分析高维数据的目的,是用来处理和分析非正态高维数据的一类统计方法,既可作探索性分析,也可作确定性分析,其特点如下:

1)投影寻踪方法能够找到观察数据结构的最佳角度,即数学意义上的线、平面维或空间维,能将所有数据向这个空间维投影,得到完全由原始数据构成的低维空间特征量。(www.xing528.com)

2)投影寻踪方法可以排除与数据结构和特征无关的,或关系很小的变量的干扰,突出其他变量的作用,达到最佳的分析效果。

3)由于投影寻踪方法可以将高维数据投影到一维子空间上进行数据分析、比较不同一维投影的分析结果,从而找出最好的投影方向,因此投影寻踪方法为使用一维统计方法来解决高维数据问题开辟了途径。

4)自然科学中有许多数据不符合正态分布,研究者需要从数据本身找出其结构或特征。投影寻踪方法能够有效克服高维数据的“维数祸根”所带来的严重困难。

5)投影寻踪方法虽然是以数据的线性投影为基础,但它找的是线性投影的非线性结构,因此它可以用来解决一定程度的非线性问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈