首页 理论教育 地质统计学基本理论-农产品产地环境安全评估与风险防控

地质统计学基本理论-农产品产地环境安全评估与风险防控

时间:2023-11-21 理论教育 版权反馈
【摘要】:②地质统计学最大限度地利用了产地监测数据所提供的各种信息。⑤地质统计学能给出估计精度。经过几十年的发展,目前的地质统计学已初步形成了一套较完整的理论体系和基本工作方法。地质统计学已逐渐成为了解土壤环境质量特点、分析污染原因、进行土壤污染风险评价及质量评估不可缺少的重要工具之一。地质统计学根据其应用条件,适用范围及计算模式的不同有很多的分支。

地质统计学基本理论-农产品产地环境安全评估与风险防控

地质统计学是空间统计学的分支之一,是结合地质学、统计学的交叉边缘学科,它是以区域变量理论为基础,以变异函数为主要工具,采用不同的插值方法,研究那些在空间上既有随机性又有结构性的自然现象的学科。与经典统计学方法相比,地质统计学有其明显的优势:①地质统计学不是简单地把现成的概率统计理论、方法直接搬到农业环境领域中来套用,而是从污染物空间变异的实际出发,根据变量本身的特点来选择合适的数学概念、理论、模型、方法,并加以改造、创新,使之适应污染物空间变化分析特殊性的需要。②地质统计学最大限度地利用了产地监测数据所提供的各种信息。③地质统计学不仅可以进行污染物空间分布的整体估计,更可以进行局部估计。④地质统计学估计出的污染物含量及分布情况一般比传统方法的数字更为精确,至少可避免系统误差。⑤地质统计学能给出估计精度。⑥地质统计学方法有较为完善的统计模型及计算机程序如ArcGIS地质统计学模块、ISATIS、GS+、Surfer、gslib等作为支撑,虽然理论复杂,但如果掌握了其各种方法的适用条件及精度控制方法,使用起来就非常方便,且可以做到自动成图及对成图进行多种统计分析。⑦地质统计学中的条件模拟可以很好地再现变量的变化性(或波动性)。

经过几十年的发展,目前的地质统计学已初步形成了一套较完整的理论体系和基本工作方法。地质统计学已逐渐成为了解土壤环境质量特点、分析污染原因、进行土壤污染风险评价及质量评估不可缺少的重要工具之一。地质统计学根据其应用条件,适用范围及计算模式的不同有很多的分支。如果采用的克里金估计量都是已知样品数据的某种线性组合,此种地质统计学方法属于线性地质统计学的范畴,称为线性地质统计学,线性地质统计学方法有普通克里金法、一般克里金法、泛克里金法、因子克里金法等。如果估计量是已知样品数据的某种非线性组合,则此种地质统计学方法属于非线性地质统计学的范畴,非线性地质统计方法主要有析取克里金法、模拟值法等。如果根据对估计变量的分布假设的要求的不同,可分为参数地质统计学和非参数地质统计学,由克里金与Matheron的思想发展起来的地质统计学方法,全都使用观测值线性组合的估计量(有时将观测数据进行转换),通过线性加权进行修改,因而方法的整体属于广义线性模型的范围,这种线性模型是绝大多数参数统计的基础。下面就地质统计学相关概念做简要介绍。

(1)区域化变量 区域化变量是以空间点x的3个直角坐标xu、xv、xw自变量的随机场Z(xu,xv,xw)=Z(x)。当人们对它进行一次随机观测后,就得到它的一个实现Z(x),它是一个普通的三元实测值函数,或者说是空间点函数。因此,区域化变量Z(x)的含义有两重性:观测前,把Z(x)看作随机场,观测后,把Z(x)看作一个普通的三元实值函数(或空间点函数)。

在土壤环境质量评估中,由于主要考虑的是0~20cm耕作层的土壤环境质量情况,且样品以均样为主。因此,本节所称的区域化变量是二维的。每次观测后得到的一个实现也是一个二元实测函数值或空间点函数值。

(2)协方差函数 区域化变量Z(x)在空间两点x和(x+h)处的两个随机变量Z(x)和Z(x+h)的二阶中心混合中心矩Cov [Z(x),Z(x+h)]=C(x,x+h)=E[Z(x)·Z(x+h)]-E[Z(x)]·E[Z(x+h)]称为区域化变量Z(x)的自协方差函数,简称协方差函数。

一般地,它是一个依赖于空间点x和向量h的函数。当h=0时,它变为C(x,x)=E[Z(x)]2-{E[Z(x)]}2,此时称为验前方差或先验方差。

根据协方差函数的定义公式,可得到协方差函数的计算公式为:

式(3-18)中,N为样本数。

协方差函数的计算与半变异函数的计算格式相同,实际上,在计算半变异函数时也计算出了协方差函数。

协方差函数具有以下性质:①C(0)=Var[Z(x)]≥0,即先验方差不能小于0;②C(h)=C(-h)C(h)对于h=0的直线是对称的,它是一个偶函数;③|C(h)|≤C(0)协方差函数绝对值小于等于先验方差;④|h|→∞时,C(h)→0,当空间距离增加时,相关性降低或不存在;⑤C(h)必须是一个非负定的函数。这5个性质对于判定协方差函数的正确性至关重要。

(3)变异函数 变异函数是地质统计学特有的工具,它既能描述区域化变量的结构性变化,又能描述其随机性变化。

首先对一维的情况来定义变异函数,设区域化变量Z(x)定义在一维数轴x上,把Z(x)在x、x+h两点处的值之差的方差定义为Z(x)在x轴方向上的一维变异函数,记为:

在实际应用中,常用变异函数2r(x,h)的一半,即半变异函数r(x,h)来表征区域化变量的结构性和随机性,而不用变异函数。

在二阶平稳假设或本征假设(内蕴假设)条件下,半变异函数可简化为以下形式:

这是地质统计学最常用的基本公式之一。

在二阶平稳假设条件下,r(x,h)实际是与x取值无关的,只依赖于h(基本步长),则可把半变异函数写成r(h)。

在实际应用中,半变异函数常无法直接计算,而采用计算实验半变异函数,然后用正则定模型拟合实验半变异函数而得到。实验半变异函数的计算公式为:

在二维空间中,半变异函数不但与分隔距离h相关,还与方向相关,如果r(r=|h|表示分离距离的大小)在二维空间中只依赖于分离距离的大小而不依赖于它的方向,称r是各向同性的,也称区域化变量Z(x)各向同性,并且此变异函数称为全方位变异函数;否则,就称r为各向异性的,即r(h)=r(r,θ)。(www.xing528.com)

半变异函数功能有:①通过“变程”反映变量的影响范围;②变差函数在原点处的性状可反映变量的空间连续性;③不同方向上的变差可反映区域化变量的各向异性;④变差函数如果是跃迁型,其基台值的大小可反映变量在该方向上的变化幅度的大小;⑤块金常数C0的大小可反映区域化变量的随机性大小。

设区域化变量Z(x)满足二阶平稳假设,则有r(h)存在且平稳,并有下述性质:①r(0)=0;②r(h)≥0;③r(-h)=r(h);④[-r(h)]必须是条件非负定函数;⑤r(∞)=C(0)。

(4)平稳假设和本征假设 从定义上看,协方差函数和变异函数同样都依赖于两个支集点x1、x2。如果确定这种情况,则对任何可能的统计推断需用随机变量[Z(x1,x2)]的多次实现。另一方面如果这些函数仅依赖于这两个支集点的距离h=x2-x1,而与x1、x2位置无关,则统计推断成为可能,由h所分开的第一数据对[Z(x),Z(x+h)]可看成是一对随机变量的不同次的实现。直观来看,两个数据Z(x)和Z(x+h)之间存在的相互关系并不取决于它们的具体位置,而是依赖于这两点的距离h。可以看出,普通随机变量的取值按某种概率分布而变化,而区域化变量根据其在一个区域内的位置来取值。也就是说,区域化变量是普通随机变量在区域内确定位置上的特定取值,它是随机变量与位置有关,特别是与距离有关的随机函数。区域化变量考虑系统属性在所有分离距离上任意两样本间的差异,并将此差异用方差来表示,这就是变异函数r(x,h)或r(h)。因此,要估计方差值,即估计变异函数值,就要估计数学期望E[Z(x)-Z(x+h)]2,因而必须有足够的若干对Z(x)和Z(x+h)的值,可能通过求[Z(x)-Z(x+h)]2的平均值的方法来估计E[Z(x)-Z(x+h)]2。但是在地质统计学中,空间抽样只能得到一对这样的数值Z(x)和Z(x+h),不可能在空间上同一点取得重复,这就在统计推断上出现了困难。为了克服这个困难,能够使用变异函数,必须对区域化变量Z(x)做一些假设,即区域化变量的二阶平稳和本征假设。

当区域化变量Z(x)满足下面两个条件时,称该区域化变量是二阶平稳的。

①在整个研究区域内,区域化变量Z(x)的数据期望对任意x存在且等于常数,即:

②在整个研究区内,区域化变量的协方差函数对任意x和h存在且平稳,即:

当h=0时,

说明协方差平稳意味着方差和变异函数的平稳。

当区域化变量Z(x)满足下面两个条件时,称该区域化变量是本征的或弱二阶平稳。①在整个研究区域内,区域化变量Z(x)的增量Z(x)-Z(x+h)的数学期望对任意x和h存在且等于0,即E [Z(x)-Z(x+h)]=0。②在整个研究区域内,区域化变量的增量[Z(x)-Z(x+h)]的方差函数对任意x和h存在且平稳,即Var[Z(x)-Z(x+h)]=E [Z(x)+Z(x+h)]2=2r(x,h)=2r(h)。

在地质统计学中常会遇到这种情况,即区域化变量Z(x)在整个研究区域内并不满足二阶平稳假设和本征假设,但在有限的领域内,是满足二阶平稳假设和本征假设的,此时,称区域化变量Z(x)是准二阶平稳和准本征的。这也就是说,协方差函数C(h)和半变异函数r(h)只能用于或限定距离|h|≤a的情况。

(5)变量函数的理论模型 设Z(x)是一个二阶平稳的区域化变量,其平均值为m,协方差是C(h),变异函数是r(h),Z(x)是以下形式的任何有限的线性结合:

对于任何权重λi,这一线性组合也是一个随机函数,并且其方差必须是非负定的,即Var[Z(x)]≥0,为了满足这一条件,对于所有选择的权重,协方差必须满足下式:

变异函数必须满足下式:

对于所选择的权重λi,应有∑λi=0,保证Var[Z(x)]≥0,称为变异函数模型的条件正则定,是选择有效变异函数模型的一个条件。满足正则定条件的一种方式就是运用一些已知的,满足正则定条件的变异函数或其线性组合。常见的变异函数模型有球形模型、指数模型、高斯模型、幂函数模型、线性模型、纯块金效应模型、空穴效应模型及各模型的线性结合模型或套合结构模型。

一个理想的变异函数曲线如图3-1所示。图3-1中的曲线包括如下几个部分:C0称为块金效应,表示h很小时两点间观测指标的变化;α称为变程,当h≤α时,任意两点间的观测值有相关性,这个相关性随h的增加而变小,当h>α时就不再有相关性,α的大小反映了研究对象中某一区域化变量,如重金属含量的变化程度。从另一个意义看,α反映了影响范围。估值C称为基台值,是先验方差与块金效应之差。它反映了区域化变量在研究范围内的变异强度,它是最大滞后距离的可迁性变异函数的极限值。当h趋于无限大时r(∞)=C(0)=Var[Z(x)]=C,即当h趋于无限大时,变异函数值近于先验方差C(0)。当无块金效应(常数)C时,r(h)=C;当有块金效应时,r(h)=C+C0

图3-1 变异函数曲线示意图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈