空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其他空间现象的分布模式进行比较,它包括了空间内插和外推两种算法。空间内插算法是一种通过已知点的数据推求同一区域其他未知点数据的计算方法;空间外推算法则是通过已知区域的数据,推求其他区域数据的方法。在以下几种情况下必须作空间插值:
(1)现有的离散曲面的分辨率,象元大小或方向与所要求的不符,需要重新插值。例如将一个扫描影像(航空像片、遥感影像)从一种分辨率或方向转换到另一种分辨率或方向的影像。
(2)现有的连续曲面的数据模型与所需的数据模型不符,需要重新插值。如将一个连续的曲面从一种空间切分方式变为另一种空间切分方式,从TIN到栅格、栅格到TIN或矢量多边形到栅格。
(3)现有的数据不能完全覆盖所要求的区域范围,需要插值。如将离散的采样点数据内插为连续的数据表面。
空间插值的理论假设是空间位置上越靠近的点,越可能具有相似的特征值;而距离越远的点,其特征值相似的可能性越小。然而,还有另外一种特殊的插值方法——分类,它不考虑不同类别测量值之间的空间联系,只考虑分类意义上的平均值或中值,为同类地物赋属性值。它主要用于地质、土壤、植被或土地利用的等值区域图或专题地图的处理,在“景观单元”或图斑内部是均匀和同质的,通常被赋给一个均一的属性值,变化发生在边界上。
空间插值的数据通常是复杂空间变化有限的采样点的测量数据,这些已知的测量数据称为“硬数据”。如果采样点数据比较少的情况下,可以根据已知的导致某种空间变化的自然过程或现象的信息机理,辅助进行空间插值,这种已知的信息机理,称为“软信息”。但通常情况下,由于不清楚这种自然过程机理,往往不得不对该问题的属性在空间的变化作一些假设,例如假设采样点之间的数据变化是平滑变化,并假设服从某种分布概率和统计稳定性关系。
采样点的空间位置对空间插值的结果影响很大,理想的情况是在研究区内均匀布点。然而当区域景观大量存在有规律的空间分布模式时,如有规律间隔的数或沟渠,用完全规则的采样网络则显然会得到片面的结果,正是这个原因,统计学家希望通过一些随机的采样来计算无偏的均值和方差。但是完全随机的采样同样存在缺陷,首先随机的采样点的分布位置是不相关的,而规则采样点的分布则只需要一个起点位置,方向和固定大小的间隔,尤其是在复杂的山地和林地里比较容易。其次完全随机采样,会导致采样点的分布不均,一些点的数据密集,另一些点的数据缺少。图4-13列出空间采样点分布的几种选择。
空间插值方法可以分为整体插值和局部插值方法两类。整体插值方法用研究区所有采样点的数据进行全区特征拟合;局部插值方法是仅仅用邻近的数据点来估计未知点的值。整体插值方法通常不直接用于空间插值,而是用来检测不同于总趋势的最大偏离部分,在去除了宏观地物特征后,可用剩余残差来进行局部插值。由于整体插值方法将短尺度的、局部的变化看作随机的和非结构的噪声,从而丢失了这一部分信息。局部插值方法恰好能弥补整体插值方法的缺陷,可用于局部异常值,而且不受插值表面上其他点的内插值影响。
(1)权重距离递减(Inverse Distance Weighted):该方法假设每个采样点有一个局部影响,此影响随着采样点到要素距离的增大而减少,距要素较近的点具有相对较大的权重。距离倒数插值方法是GIS软件根据点数据生成栅格图层的最常见方法。权重距离递减法计算值易受数据点集群的影响,计算结果经常出现一种孤立点数据明显高于周围数据点的“鸭蛋”分布模式,可以在插值过程中通过动态修改搜索准则进行一定程度的改进。
(2)样条函数内插(Spline):此方法的用途非常广泛,通过所有的采样点建立一个数学函数,从而产生一个曲率最小的表面。样条函数是一个分段函数,进行一次拟合只有少数点拟合,同时保证曲线段连接处连续,这就意味着样条函数可以修改少数数据点配准而不必重新计算整条曲线。样条函数的一些缺点是:样条内插的误差不能直接估算,同时在实践中要解决的问题是样条块的定义以及如何在三维空间中将这些“块”拼成复杂曲面,又不引入原始曲面中所没有的异常现象等问题。(www.xing528.com)
图4-13 各种不同的采样方式
(a)规则采样;(b)随机采样;(c)断面采样;(d)成层随机采样;(e)聚集采样;(f)等值线采样
(3)Kriging内插:这种方法充分吸收了地理统计的思想,认为任何在空间连续性变化的属性是非常不规则的,不能用简单的平滑数学函数进行模拟,可以用随机表面给予较恰当的描述。这种连续性变化的空间属性称为“区域性变量”,可以描述象气压、高程及其他连续性变化的描述指标变量。地理统计方法为空间插值提供了一种优化策略,即在插值过程中根据某种优化准则函数动态的决定变量的数值。Kriging插值方法着重于权重系数的确定,从而使内插函数处于最佳状态,即对给定点上的变量值提供最好的线性无偏估计。
Kriging方法考虑了观测点和被估计点的位置关系,并且也考虑各观测点之间的相对位置关系,所以在点稀少时插值效果比反距离权重等其他方法要好。Kriging法的优点是以空间统计学作为其坚实的理论基础,可以克服内插中误差难以分析的问题,能够对误差做出逐点的理论估计;不但能估计测定参数的空间变异分布,而且还可以估算估计参数的方差分布。其缺点是计算步骤较繁琐,计算量大,且变异函数有时需要根据经验人为选定。
(4)趋势面内插(Trend):某种地理属性在空间的连续变化,可以用一个平滑的数学平面加以描述。思路是先用已知采样点数据拟合出一个平滑的数学平面方程,再根据该方程计算无测量值的点上的数据。这种只根据采样点的属性数据与地理坐标的关系,进行多元回归分析得到平滑数学平面方程的方法,称为趋势面分析。它的理论假设是地理坐标(x,y)是独立变量,属性值Z也是独立变量且是正态分布的,同样回归误差也是与位置无关的独立变量。
该算法对所有的采样点,建立一个特定次数的多项式的数学函数,在计算此函数产生结果表面时,Trend采用最小二乘法进行拟合,从而使结果表面与采样点值之间的差异最小化,即所有输入样点的实际值与估计值之差的平方和越小越好。
(5)泰森多边形方法(Thiessen):采用了一种极端的边界内插方法,只用最近的单个点进行区域插值。泰森多边形按数据点位置将区域分割成子区域,每个子区域包含一个数据点,各子区域到其内数据点的距离小于任何到其他数据点的距离,并用其内数据点进行赋值。连接所有数据点的连线形成Delaunay三角形,与不规则三角网TIN具有相同的拓扑结构。
GIS和地理分析中经常采用泰森多边形进行快速的赋值,实际上泰森多边形的一个隐含的假设是任何地点的气象数据均使用距它最近的气象站的数据。而实际上,除非是有足够多的气象站,否则这个假设是不恰当的,因为降水、气压、温度等现象是连续变化的,用泰森多边形插值方法得到的结果图变化只发生在边界上,在边界内都是均质的和无变化的。
在实际应用中,没有绝对最好的空间插值方法,只有在特定的条件下,对于各种研究区域的实际情况的最佳方法。在运用空间插值方法时,要得到理想的空间插值效果,必须针对不同研究区域的实际情况,对实测数据样本点进行充分分析,反复试验比较来选择最佳的方法。最重要的是在运用一般插值方法的基础上,依据自身需要及学科的特点,对插值方法进行改进以找到更优的空间插值方法。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。