首页 理论教育 水文预报方法与应用中的投影寻踪背景

水文预报方法与应用中的投影寻踪背景

时间:2023-10-04 理论教育 版权反馈
【摘要】:但是,当数据维数大于4时,就无法通过绘图的方式直观地观察数据结构,需要将原始数据投影到可以观察到的空间维上,即1~3 维,通过在低维空间的观察来了解数据在高维空间的结构。在低维时稳健性很好的统计方法到了高维空间其稳健性就变差了。因此传统的数据分析方法对于高维非正态、非线性数据分析很难收到很好的效果。投影寻踪方法就是在这种背景下产生的。

水文预报方法与应用中的投影寻踪背景

事物在其演变过程中必然会受到许多因素的影响和制约,因此在很多实际问题中数据的维数相当高。对于一维和二维数据结构,常常采用直方图来直观地了解数据的特征,并通过这些图形的变化趋势来判断已有或未知数据的结构。虽然这种方式非常粗糙,但也能为了解数据的结构提供帮助。但是,当数据维数大于4时,就无法通过绘图的方式直观地观察数据结构,需要将原始数据投影到可以观察到的空间维上,即1~3 维,通过在低维空间的观察来了解数据在高维空间的结构。

同时在实际问题研究工作中,为了避免忽略掉任何可能的相关信息,往往在搜集资料时要全面考虑各个因素,从而使多元分析方法的应用不但普遍而且非常重要。传统的多元分析方法是建立在数据总体服从正态分布的基础上的,而实际上许多数据并不满足正态分布的假定,需要用稳健的、实用的方法来解决。但是,当数据维数较高时,这些方法将面临一些困难,主要表现在三个方面:

(1)随着维数的增加,计算量呈几何增加,而且不可能绘出可视的分布图或其他图形。

(2)当数据维数较高时,即使数据的样本点很多,但散在高维空间中仍显得非常稀疏,Bellman将这种现象称为“维数祸根”,这使得许多在一维情况下比较成功的传统方法,如关于密度函数估计的核估计法、邻域法等不能适用。因而在研究高维数据时,常采用聚类分析因子分析、典型相关分析等方法,但这些方法仅着眼于变量间的距离,而忽略了不相干变量的存在,使研究者无法确定结果的正确性。(www.xing528.com)

(3)在低维时稳健性很好的统计方法到了高维空间其稳健性就变差了。

因此传统的数据分析方法对于高维非正态、非线性数据分析很难收到很好的效果。原因在于这些方法过于形式化、数学化,无法找到数据的内在规律和特征,不能满足高维非正态分布数据分析的需要。投影寻踪方法就是在这种背景下产生的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈