首页 理论教育 空间离散点数据插值方法介绍

空间离散点数据插值方法介绍

时间:2023-06-24 理论教育 版权反馈
【摘要】:另外,在带约束TIN三角网生成过程中,约束线的空间定位也需要通过依据离散数据进行插值来确定。空间离散点数据插值方法很多,下面将对常用的数据插值方法逐一进行介绍。计算一个网格节点时,给予一个特定数据点的权值,与指定方次的节点到观测点的距离倒数成比例。克里金法广泛地应用于地下水模拟、土壤制图等领域,是一种很有用的地质统计网格化方法。在数据点多时,其内插的结果可信度较高。

空间离散点数据插值方法介绍

在建立数字地面模型时获取的原始数据大多是不规则的离散数据,由于数据的过疏或过密等原因,而不能满足数字地面模型的建模要求,通常需要对原始数据进行插值处理。另外,在带约束TIN三角网生成过程中,约束线的空间定位也需要通过依据离散数据进行插值来确定。空间离散点数据插值方法很多,下面将对常用的数据插值方法逐一进行介绍。

1.反距离加权插值法

反距离加权插值法(Inverse Distance Weighted)首先是由气象学家和地质工作者提出的,后来由于D.Shepard的工作被称为谢别德法。它的基本原理是设平面上分布一系列离散点,已知其位置坐标(xi,yi)和属性值zi(i=1,2,…,n),p(x,y)为任一网格点,根据周围离散点的属性值,通过距离加权插值求P点属性值。距离加权插值法综合了泰森多边形(Thiessen,又叫Dirichlet或Voronoi多边形)的邻近点法和多元回归法的渐变方法的长处,它假设P点的属性值是在局部邻域内所有数据点的距离加权平均值,可以进行确切的或者圆滑的方式插值。周围点与P点因分布位置的差异,对P(z)影响不同,这种影响称为权函数wi(x,y),参数u控制着权系数如何随着离开一个网格节点距离的增加而下降。对于一个较大的u,较近的数据点被给定一个较高的权重份额;对于一个较小的方次,权重比较均匀地分配给各数据点。计算一个网格节点时,给予一个特定数据点的权值,与指定方次的节点到观测点的距离倒数成比例。当计算一个网格节点时,配给的权重是一个分数,所有权重的总和等于1.0。当一个观测点与一个网格节点重合时,该观测点被给予一个实际为1.0的权重,所有其他观测点被给予一个几乎为0.0的权重。换言之,该节点被赋给与观测点一致的值,这就是一个准确插值。权函数主要与距离有关,有时也与方向有关,若在P点周围四个方向上均匀取点,那么可不考虑方向因素,这时

反距离加权插值法是GIS软件根据点数生成规则网格数据文件的最常见的方法,计算值易受数据点集群的影响,计算结果易受孤立点数据的影响而出现失真,可在插值过程中通过动态修改搜索准则进行一定程度的改进。使用反距离加权插值法对数据进行网格化时,可以指定一个圆滑参数。圆滑参数要求大于零。对于一个特定的节点,没有哪个观测点被赋予全部的权值,即使观测点与该节点重合也是如此。圆滑参数通过修匀已被插值的网格来降低孤立点数据的影响。

2.克里金插值法

克里金(Kriging)插值法又称空间自协方差最佳插值法,它是以法国D.G.Krige的名字命名的一种最优内插法。克里金法广泛地应用于地下水模拟、土壤制图等领域,是一种很有用的地质统计网格化方法。它首先考虑的是空间属性在空间位置上的变异分布,确定对一个待插点值有影响的距离范围,然后用此范围内的采样点来估计待插点的属性值。该方法在数学上可对所研究的对象提供一种最佳线性无偏估计(某点处的确定值)的方法。它是考虑了信息样品的形状、大小及与待估计块段相互间的空间位置等几何特征以及品位的空间结构之后,为达到线性、无偏和最小估计方差的估计,而对每一个样品赋予一定的系数,最后进行加权平均来估计块段品位的方法。但它仍是一种光滑的内插方法。在数据点多时,其内插的结果可信度较高。

克里金法类型分常规克里金插值(常规克里金模型/克里金点模型)和块克里金插值。常规克里金插值其内插值与原始样本的容量有关,当样本数量较少的情况下,采用简单的常规克里金模型内插的结果图会出现明显的凹凸现象;块克里金插值是通过修改克里金方程以估计子块B内的平均值来克服克里金点模型的缺点,对估算给定面积实验小区的平均值或对给定网格大小的规则网格进行插值比较适用。块克里金插值估算的方差结果常小于常规克里金插值,所以,生成的平滑插值表面不会发生常规克里金模型的凹凸现象。按照空间场是否存在漂移(Drift)可将克里金插值分为普通克里金和泛克里金,其中普通克里金(Ordinary Kriging,简称OK法)常称为局部最优线性无偏估计,所谓线性是指估计值是样本值的线性组合,即加权线性平均,无偏是指理论上估计值的平均值等于实际样本值的平均值,即估计的平均误差为0,最优是指估计的误差方差最小。

3.最小曲率

最小曲率法(Minimum Curvature)广泛应用于地球科学。用最小曲率法生成的插值面类似于一个通过各个数据值、具有最小弯曲量的长条形薄薄的弹性片。最小曲率法试图在尽可能严格地尊重数据的同时,生成尽可能圆滑的曲面。最小曲率法不是一个精确的插值法,也就是说在插值的过程中不可能总是完全尊重数据。

4.改进谢别德法

改进谢别德法(Modified Quadratic Shepard)是由Franke及Nielson提出,它仍是一个与距离成反比的加权方法。在使用反距离加权插值法时,当增加、删除或改变一个点时,需要重新计算权函数wi(x,y),为了克服反距离加权插值法的这一缺陷,改进谢别德法同样使用距离倒数加权的最小二乘方的方法,但有以下两个方面的改进:

(1)通过修改反距离加权插值法的权函数wi(x,y)=1/[di(x,y)]u使其只能在局部范围内起作用,以改变反距离加权插值法的全局插值性质,即它利用了局部最小二乘法来消除或减少所生成等值线的畸形区域。

(2)同时用节点函数Qi(x,y)来代替离散点(xi,yi)的属性值zi,Qi(x,y)是一个插值于(xi,yi)点的二次多项式,即有Qi(xi,yi)=zi(i=1,2,…,n)。而且Qi(x,y)在点(xi,yi)附近与函数属性值在z(x,y)具有局部近似的性质。因此,如果认为距离(xi,yi)较远的点对Qi(x,y)影响不大,则可以认为在(xi,yi)点附近,Qi(x,y)就可以近似地表示函数属性值z(x,y)了。改进谢别德法可以是一个准确或圆滑插值器。

5.自然邻点插值法

自然邻点插值法(Natural Neighbor)的基本原理是对于一组泰森多边形,当在数据集中加入一个新的数据点(目标)时,就会修改这些泰森多边形,而使用邻点的权重平均值将决定待插点的权重,待插点的权重和目标泰森多边形成比例。实际上,在这些多边形中,有一些多边形的尺寸将缩小,并且没有一个多边形的大小会增加。同时,自然邻点插值法在数据点凸起的位置并不外推等值线(如泰森多边形的轮廓线)。

6.最近邻点插值法

最近邻点插值法(Nearest Neighbor)又称泰森多边形方法,泰森多边形分析法是荷兰气象学家A.H.Thiessen提出的一种分析方法。最初用于从离散分布气象站的降雨量数据中计算平均降雨量,现在GIS和地理分析中经常采用泰森多边形进行快速赋值。实际上,最近邻点插值的一个隐含的假设条件是任一网格点p(x,y)的属性值都使用距它最近的位置点的属性值,用每一个网格节点的最邻点值作为它的节点值。当数据已经是均匀间隔分布,要先将数据转换为SURFER的网格文件,可以应用最近邻点插值法;或者在一个文件中,数据紧密完整,只有少数点没有取值,可用最近邻点插值法来填充无值的数据点。

有时需要排除网格文件中的无值数据的区域,在搜索椭圆(Search Ellipse)设置一个值,对无数据区域赋予该网格文件里的空白值。设置的搜索半径的大小要小于该网格文件数据值之间的距离,所有的无数据网格节点都被赋予空白值。在使用最近邻点插值网格化法,将一个规则间隔的XYZ数据转换为一个网格文件时,可设置网格间隔和XYZ数据的数据点之间的间距相等。最近邻点插值网格化法是均质且无变化的,对均匀间隔的数据进行插值很有用,同时,它对填充无值数据的区域很有效。

7.多元回归法

多元回归(Polynomial Regression)是用来确定数据的大规模的趋势和图案。多元回归实际上不是插值器,因为它并不预测未知的z值,它只是根据空间的采样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况,它实际上是一个趋势面分析作图程序。

趋势面分析是对地质特征的空间分布进行研究和分析的一种方法,它是用某种形式的函数所代表的曲面来逼近该地质特征的空间分布。这个函数从总体上反映了采样数据的区域性变化趋势,称为趋势面部分;采样数据的实测值与这个函数对应值之差,称为偏差部分,它反映了局部性的变化。也就是说,把采样数据的实测值分解成两部分,趋势面部分和偏差部分,趋势面部分用一个函数表示,它反映采样数据的总体变化,可以认为是由大范围的系统性因素引起的;偏差部分反映了局部性的变化特点,可以认为是由局部因素和随机因素引起的。

使用多元回归法进行趋势面分析要考虑两个方面的问题:一是趋势面函数(数学表达式)的确定;二是拟合精度的确定。通常用的趋势面函数主要是多项式趋势面,因为多项式能够逼近任意连续函数,因此,用多项式作趋势面能较好地反映连续变化的分布趋势,这在地质科学中常用到。一般来说,多项式次数越高,趋势面与实测数据偏差越小,但是,并不能说它就与实际情况最符合,这还要在实践中检验,次数较高的趋势面只在采样点附近效果较好,在外推和内插的效果方面不好,因而在实际应用的效果并不理想。在实际应用中,对起伏变化比较缓和的简单采样数据配合次数较低的趋势面,就可以反映出区域背景;而变化复杂且起伏较多的采样数据要配合次数较高的趋势面。

8.径向基函数插值法

所谓径向基函数(Radial Basis Function),其基函数是由单个变量的函数构成的。一个点(x,y)的这种基函数的形式往往是hi(x,y)=h(di),这里的di表示由点(x,y)到第i个数据点的距离。径向基函数插值法是多个数据插值方法的组合。根据生成一个圆滑曲面适应数据的能力,许多人认为其中的复二次函数是最好的方法。所有径向基函数插值法都是准确的插值器,它们都能尽量适应样本数据。若要生成一个更圆滑的曲面,对所有这些方法都可以引入一个圆滑系数。

径向基函数最基本的函数类似于克里金中的方差图。当对于一个网格点插值时,这些函数为数据点规定了一套最佳权重。常用基函数类型有

反距离加权插值法是GIS软件根据点数生成规则网格数据文件的最常见的方法,计算值易受数据点集群的影响,计算结果易受孤立点数据的影响而出现失真,可在插值过程中通过动态修改搜索准则进行一定程度的改进。使用反距离加权插值法对数据进行网格化时,可以指定一个圆滑参数。圆滑参数要求大于零。对于一个特定的节点,没有哪个观测点被赋予全部的权值,即使观测点与该节点重合也是如此。圆滑参数通过修匀已被插值的网格来降低孤立点数据的影响。

2.克里金插值法

克里金(Kriging)插值法又称空间自协方差最佳插值法,它是以法国D.G.Krige的名字命名的一种最优内插法。克里金法广泛地应用于地下水模拟、土壤制图等领域,是一种很有用的地质统计网格化方法。它首先考虑的是空间属性在空间位置上的变异分布,确定对一个待插点值有影响的距离范围,然后用此范围内的采样点来估计待插点的属性值。该方法在数学上可对所研究的对象提供一种最佳线性无偏估计(某点处的确定值)的方法。它是考虑了信息样品的形状、大小及与待估计块段相互间的空间位置等几何特征以及品位的空间结构之后,为达到线性、无偏和最小估计方差的估计,而对每一个样品赋予一定的系数,最后进行加权平均来估计块段品位的方法。但它仍是一种光滑的内插方法。在数据点多时,其内插的结果可信度较高。

克里金法类型分常规克里金插值(常规克里金模型/克里金点模型)和块克里金插值。常规克里金插值其内插值与原始样本的容量有关,当样本数量较少的情况下,采用简单的常规克里金模型内插的结果图会出现明显的凹凸现象;块克里金插值是通过修改克里金方程以估计子块B内的平均值来克服克里金点模型的缺点,对估算给定面积实验小区的平均值或对给定网格大小的规则网格进行插值比较适用。块克里金插值估算的方差结果常小于常规克里金插值,所以,生成的平滑插值表面不会发生常规克里金模型的凹凸现象。按照空间场是否存在漂移(Drift)可将克里金插值分为普通克里金和泛克里金,其中普通克里金(Ordinary Kriging,简称OK法)常称为局部最优线性无偏估计,所谓线性是指估计值是样本值的线性组合,即加权线性平均,无偏是指理论上估计值的平均值等于实际样本值的平均值,即估计的平均误差为0,最优是指估计的误差方差最小。

3.最小曲率法

最小曲率法(Minimum Curvature)广泛应用于地球科学。用最小曲率法生成的插值面类似于一个通过各个数据值、具有最小弯曲量的长条形薄薄的弹性片。最小曲率法试图在尽可能严格地尊重数据的同时,生成尽可能圆滑的曲面。最小曲率法不是一个精确的插值法,也就是说在插值的过程中不可能总是完全尊重数据。

4.改进谢别德法(www.xing528.com)

改进谢别德法(Modified Quadratic Shepard)是由Franke及Nielson提出,它仍是一个与距离成反比的加权方法。在使用反距离加权插值法时,当增加、删除或改变一个点时,需要重新计算权函数wi(x,y),为了克服反距离加权插值法的这一缺陷,改进谢别德法同样使用距离倒数加权的最小二乘方的方法,但有以下两个方面的改进:

(1)通过修改反距离加权插值法的权函数wi(x,y)=1/[di(x,y)]u使其只能在局部范围内起作用,以改变反距离加权插值法的全局插值性质,即它利用了局部最小二乘法来消除或减少所生成等值线的畸形区域。

(2)同时用节点函数Qi(x,y)来代替离散点(xi,yi)的属性值zi,Qi(x,y)是一个插值于(xi,yi)点的二次多项式,即有Qi(xi,yi)=zi(i=1,2,…,n)。而且Qi(x,y)在点(xi,yi)附近与函数属性值在z(x,y)具有局部近似的性质。因此,如果认为距离(xi,yi)较远的点对Qi(x,y)影响不大,则可以认为在(xi,yi)点附近,Qi(x,y)就可以近似地表示函数属性值z(x,y)了。改进谢别德法可以是一个准确或圆滑插值器。

5.自然邻点插值法

自然邻点插值法(Natural Neighbor)的基本原理是对于一组泰森多边形,当在数据集中加入一个新的数据点(目标)时,就会修改这些泰森多边形,而使用邻点的权重平均值将决定待插点的权重,待插点的权重和目标泰森多边形成比例。实际上,在这些多边形中,有一些多边形的尺寸将缩小,并且没有一个多边形的大小会增加。同时,自然邻点插值法在数据点凸起的位置并不外推等值线(如泰森多边形的轮廓线)。

6.最近邻点插值法

最近邻点插值法(Nearest Neighbor)又称泰森多边形方法,泰森多边形分析法是荷兰气象学家A.H.Thiessen提出的一种分析方法。最初用于从离散分布气象站的降雨量数据中计算平均降雨量,现在GIS和地理分析中经常采用泰森多边形进行快速赋值。实际上,最近邻点插值的一个隐含的假设条件是任一网格点p(x,y)的属性值都使用距它最近的位置点的属性值,用每一个网格节点的最邻点值作为它的节点值。当数据已经是均匀间隔分布,要先将数据转换为SURFER的网格文件,可以应用最近邻点插值法;或者在一个文件中,数据紧密完整,只有少数点没有取值,可用最近邻点插值法来填充无值的数据点。

有时需要排除网格文件中的无值数据的区域,在搜索椭圆(Search Ellipse)设置一个值,对无数据区域赋予该网格文件里的空白值。设置的搜索半径的大小要小于该网格文件数据值之间的距离,所有的无数据网格节点都被赋予空白值。在使用最近邻点插值网格化法,将一个规则间隔的XYZ数据转换为一个网格文件时,可设置网格间隔和XYZ数据的数据点之间的间距相等。最近邻点插值网格化法是均质且无变化的,对均匀间隔的数据进行插值很有用,同时,它对填充无值数据的区域很有效。

7.多元回归法

多元回归(Polynomial Regression)是用来确定数据的大规模的趋势和图案。多元回归实际上不是插值器,因为它并不预测未知的z值,它只是根据空间的采样数据,拟合一个数学曲面,用该数学曲面来反映空间分布的变化情况,它实际上是一个趋势面分析作图程序。

趋势面分析是对地质特征的空间分布进行研究和分析的一种方法,它是用某种形式的函数所代表的曲面来逼近该地质特征的空间分布。这个函数从总体上反映了采样数据的区域性变化趋势,称为趋势面部分;采样数据的实测值与这个函数对应值之差,称为偏差部分,它反映了局部性的变化。也就是说,把采样数据的实测值分解成两部分,趋势面部分和偏差部分,趋势面部分用一个函数表示,它反映采样数据的总体变化,可以认为是由大范围的系统性因素引起的;偏差部分反映了局部性的变化特点,可以认为是由局部因素和随机因素引起的。

使用多元回归法进行趋势面分析要考虑两个方面的问题:一是趋势面函数(数学表达式)的确定;二是拟合精度的确定。通常用的趋势面函数主要是多项式趋势面,因为多项式能够逼近任意连续函数,因此,用多项式作趋势面能较好地反映连续变化的分布趋势,这在地质科学中常用到。一般来说,多项式次数越高,趋势面与实测数据偏差越小,但是,并不能说它就与实际情况最符合,这还要在实践中检验,次数较高的趋势面只在采样点附近效果较好,在外推和内插的效果方面不好,因而在实际应用的效果并不理想。在实际应用中,对起伏变化比较缓和的简单采样数据配合次数较低的趋势面,就可以反映出区域背景;而变化复杂且起伏较多的采样数据要配合次数较高的趋势面。

8.径向基函数插值法

所谓径向基函数(Radial Basis Function),其基函数是由单个变量的函数构成的。一个点(x,y)的这种基函数的形式往往是hi(x,y)=h(di),这里的di表示由点(x,y)到第i个数据点的距离。径向基函数插值法是多个数据插值方法的组合。根据生成一个圆滑曲面适应数据的能力,许多人认为其中的复二次函数是最好的方法。所有径向基函数插值法都是准确的插值器,它们都能尽量适应样本数据。若要生成一个更圆滑的曲面,对所有这些方法都可以引入一个圆滑系数。

径向基函数最基本的函数类似于克里金中的方差图。当对于一个网格点插值时,这些函数为数据点规定了一套最佳权重。常用基函数类型有

式中:h为表示由点(x,y)到第i个数据点的距离;R参数是用户指定的平滑因子。

其中的复二次函数(Multi-quadric)方法是由R.L.Hardy在1971年提出来的。它是最早提出并且应用得最为成功的一种径向基函数插值法。现在复二次函数方法在水文测量、大地测量、地质及采矿、地球物理等领域都得到了广泛应用,效果良好。在数据点数量不太大的情况下(例如,几百个数据点),计算也不太复杂。

薄板样条法(Thin Plate Spline)是由R.L.Harder及R.N.Desmarais在1972年提出来的,后来得到了J.Duchon及J.Meinguet等人进一步发展。从力学的观点看,这一方法的实质是使插值函数所代表的弹性薄板受限于插值点,并且具有最小的弯曲能量。

9.三角网/线性插值法

三角网/线性插值法(Triangulation with Linear Interpolation)使用最佳的Delaunay三角形,连接数据点间的连线形成三角形,然后基于三角面对待插点进行空间内插。原始数据点的连接方法是这样:所有三角形的边都不能与另外的三角形相交,其结果构成了一张由三角形拼接起来的覆盖网格范围的网。每一个三角形定义了一个覆盖该三角形内网格节点的面。三角形的倾斜和标高由定义这个三角形的三个原始数据点确定。给定三角形内的全部节点都要受到该三角形的表面的限制。因为各个三角形都是用原始数据点来定义的,这样就把三角形和样本数据紧密联系起来。三角网/线性插值法将在网格范围内均匀分配数据,地图上稀疏的区域将会形成截然不同的三角面。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈