6.1.1.1 空间插值数据源
在科学计算领域中,空间插值是常用的数据空间展布方法,用于将离散点、线状测量数据转换为连续的数据曲面。为获得连续表面所需要的空间插值数据源包括:野外测量样点数据,数字化的线状、面状图,摄影测量得到的正射航片或卫星影像等。通常所用的空间插值数据是有限的样点测量数据,样点的位置对空间插值的结果影响很大,理想的情况是在研究区内均匀分布。文中无论是气象站点、样点观测数据或是栅格面状数据,其表现形式主要为离散点和规则点,这些数据的空间展布是由区域内的点数据过渡到面数据的关键技术。
6.1.1.2 空间数据插值方法基本原理
很多软件都内置有空间插值算法。它包括了空间内插和外推两种算法,都是基于数据的空间相关性进行的,即空间插值的理论假设是空间位置上越靠近,则事物或现象就具有相似的特征值;反之则差异性越大或者越不相关。这个假设体现了事物或现象对空间位置的依赖关系。
6.1.1.3 空间插值方法
空间插值方法从采样数据点使用的角度可分为整体插值和局部插值两大类,整体插值方法用研究区所有采样点的数据进行全区域特征拟合;局部插值方法是仅用邻近一定数量的数据点来估计未知点的值。整体插值方法通常使用方差分析和回归方程等标准的统计方法,计算比较简单。但整体插值方法将短尺度、局部的变化看作随机的和非结构的噪声,从而丢失了一部分信息。局部插值方法恰好能弥补这种缺陷,可用于局部异常值,而且不受插值表面上其他点的内插值影响。使用局部插值方法需要注意所使用的插值函数,邻域的大小、形状和方向,数据点的个数以及数据点的分布方式几个方面。
空间插值方法主要包括:最近邻点插值法(Nearest Neighbor)、自然邻近插值法(Natural Neighbor)、移动平均法(Moving Average)、径向基函数插值法(Radial Basis Function)、多元回归模型(Polynomial Regression)、克里金插值法(Kriging)和最小曲率(Minimum Curvature)等。依据插值的精确性,可分为空间统计确定性插值法和地统计插值法。
1.确定性插值法
最近邻点插值法又称泰森(Thiessen)多边形或Voronoi多边形分析法,是荷兰气象学家A.H.Thiessen提出的一种分析方法,即在每个样点数据周边生成一个邻近区域,即Thiessen多边形,从而将整个区域分割成若干子区域,每个子区域包含一个样点,各子区域内的任意一点离其内部的样点最近,在多边形内插值时只有其中心样点参与运算。GIS和地理分析中经常采用泰森多边形进行快速的插值,用该方法得到的结果图变化只发生在边界上,边界内是均质和无变化的。该插值法只适用于样点分布均匀,且只有少数缺失值时的数据填补。
自然邻近插值法是对泰森多边形插值法的改进,它对研究区内各点都赋予一个权重系数,插值时使用邻点的权重平均值决定待估点的权重,待插点的权重和目标泰森多边形成比例。每完成一次估值就将新值纳入原样点数据集重新计算泰森多边形并重新赋权重。对于由样点数据生成面状栅格数据而言,通过设置栅格大小(cellsize)来决定自然邻近插值中的泰森多边形的运行次数n,即设整个研究区的面积area,则有:n=area/cellsize,可设置各向异性参数(半径和方向)来辅助权重系数的计算。自然邻近插值法在数据点凸起的位置并不外推等值线。(www.xing528.com)
反距离权重插值法(Inverse Distance Weighting,IDW)是一种精确的整体空间插值方法,属于移动平均插值法的一种,其中距离倒数插值方法是GIS软件根据点数据生成栅格数据的最常用方法之一。它综合了自然邻近法和多元回归法的优点,在插值时认为待估点Z值为邻近区域内所有样点距离的加权平均值,样点距离最近的若干个点对待估点Z值的贡献最大,其贡献与距离成反比;当有各向异性时,还要考虑方向权重;对某待估点而言,其所有邻域的样点数的权重和为1。利用反距离权重插值法生成的表面中,预测样点与实测样点值完全相等,适用于呈均匀分布且密集程度足以反映局部差异的样点数据集;其主要缺点是可能在区域内产生围绕观测点位置的“牛眼”,为消除这种因样点数据的不均匀分布而产生的影响,可引入一个平滑参数,使得插值运算时有尽可能多的样点参与运算。
样条(Spline)函数插值法是用分段曲线的数学函数来估值,最小化所有的表面曲率、逼近曲面的一种精确插值方法,它属于径向基函数插值法的一种。样条函数进行一次拟合只有少数点参与,同时保证曲线段连接处连续,即修改少量数据点配准而不必重新计算整条曲线,故计算量不大,插值速度快。它与其他空间统计插值方法相比具有以下特点:不需要做统计假设,可以计算出高于或低于样点Z值的预测值,保留了局部变化特征,在视觉上得到了令人满意的结果。适合于根据较密的点内插等值线,特别是从不规则三角网(TIN)内插等值线;适合于非常平滑的表面,一般要求有连续的一阶和二阶导数。它的缺点是当局部变异性大,或样点数据具有很大不确定性时,插值效果不好。
上面提到的几种插值方法是基于空间统计学的确定性插值法,其优点是以空间统计学作为坚实的理论基础,可以克服内插中误差难以分析的问题,能够对误差做出逐点的理论估计,不会产生回归分析的边界效应;缺点是复杂,需要变异函数。
2.地统计插值法
地统计插值法是空间统计分析的一个分支。地统计与确定性插值法的最大区别在于它引入了概率模型,即在进行预测时能给出预测值的误差。通常所说的地统计插值指克里金插值法,它是法国地理数学家Georges Matheron和南非矿山工程师D.G.Krige提出的一种优化插值方法,最初用于矿山勘探,后被广泛应用于地下水模拟、土壤制图等领域,成为GIS软件地理统计插值的重要组成部分。这种方法充分吸收了地理统计的思想,认为任何在空间连续性变化的属性都是非常不规则的,不能用简单的平滑数学函数进行模拟,可以在插值过程中根据某种优化准则函数动态地决定变量的数值,用随机表面给予较恰当的描述。Matheron和Krige等着重研究了该方法权重系数的确定,对给定点上的变量值提供最好的线性无偏估计。该方法获得预测图并不要求数据呈正态分布,但当数据呈正态分布时,克里金插值法将是无偏估计法中效果最好的一种。
下面介绍克里金插值法。
普通克里金插值法是一个精确插值模型,制图中常用比采样间隔更细的规则格网进行插值,内插值又可换成等值线图。内插结果与原始样本的容量有关,当样本少时,简单的点普通克里金插值(点模型)方法结果图会出现明显的凹凸现象,这时可采用块克里金插值法,该方法较适用于估算给定面积试验小区的平均值或给定格网大小的规则格网插值。块克里金插值估算的方差结果常小于点克里金插值,所以生成的平滑插值表面不会发生点模型的凹凸现象。
根据样点数据统计特征的不同又可将克里金分成多种方法:当样点数据是二进制值时,用指示克里金插值法进行概率预测;对样点数据进行未知函数变换后,可用该变换函数进行析取克里金插值;当样点数据的趋势值是一个未知常量时,用普通克里金;当样点数据的趋势可用一个多项式进行拟合,但回归系数未知时,用泛克里金插值法;当样点数据的趋势已知时,用简单克里金插值法。其中最常用的是普通克里金与泛克里金插值法;当加入了协变量进行插值时,则叫作协同普通克里金插值法和协同泛克里金插值法。
克里金法的优点是以空间统计学作为其理论基础,物理含义明确,不但能估计测定参数的空间变异分布,还可以估算估计参数的方差分布;缺点是计算步骤较烦琐,计算量大,且变异函数有时需要根据经验选定。无论哪种插值方法,根据统计学假设可知,样本点越多、分布越均匀越好。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。