首页 理论教育 突发水污染应急调控关键技术与应用:概率统计方法

突发水污染应急调控关键技术与应用:概率统计方法

时间:2023-11-22 理论教育 版权反馈
【摘要】:由于溯源问题具有不适定性,在确定性方法求解时,观测误差或模型计算误差可能会使结果产生较大偏差,溯源结果失真,由此随机方法被引入到突发污染物追踪溯源研究中,其中以一类基于贝叶斯推理和MCMC抽样的概率统计方法应用最多。本部分以Bayesian-MCMC方法为例对概率统计的溯源方法进行简要介绍。对追踪溯源解后验概率分布进行抽样,从而得到突发水污染事件追踪溯源解的估计值。

突发水污染应急调控关键技术与应用:概率统计方法

由于溯源问题具有不适定性,在确定性方法求解时,观测误差或模型计算误差可能会使结果产生较大偏差,溯源结果失真,由此随机方法被引入到突发污染物追踪溯源研究中,其中以一类基于贝叶斯推理和MCMC抽样的概率统计方法应用最多。贝叶斯推理是以概率论为理论基础的一种能反映河渠突发水污染事件不确定性的方法,它在充分利用了似然函数和待求参数的先验信息基础上,求解待求参数的后验概率分布,再通过相应的抽样方法得到污染源各参数的估计值,该方法能给出水污染事件追踪溯源结果的一种随机分布函数。因此,基于贝叶斯推理的方法主要是对突发水污染事件的发生概率进行估计,它能得到追踪溯源结果的后验概率分布,而非单一解,同时能量化追踪溯源结果的不确定性,可以提供更多的关于突发水污染事件追踪溯源的信息。为有效获取突发水污染追踪溯源结果的估计值,需要贝叶斯推理与相关抽样方法结合,如马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)和随机蒙特卡罗(Monte Carlo,MC)等抽样方法。其中,MC方法是一种不管初始值是否远离真实值时均容易收敛到次优解的估计方法,因此该方法得到追踪溯源结果的准确率不高。通过将贝叶斯推理与MC方法或MCMC方法结合方式迭代得到的追踪溯源结果的分布函数,能够弥补MC方法的不足。MCMC方法是通过随机游动得到的一条足够长的Markov链,这样才能保证抽样结果接近于追踪溯源结果的后验分布,即用Markov链的极限分布来表示追踪溯源结果的后验概率密度函数。因此,MCMC方法推广了贝叶斯推理在环境污染事件追踪溯源研究中的应用。

本部分以Bayesian-MCMC方法为例对概率统计的溯源方法进行简要介绍。方法将追踪溯源研究模型中所有变量视为随机变量,并认为突发性水污染事件追踪溯源问题的解为一个概率分布,通过贝叶斯方法将问题解的先验信息转化为先验概率分布,再结合观测数据信息,利用观测值与模型计算值之间的似然函数由马尔科夫链随机抽样过程得到所求问题解的后验概率分布。方法主要过程如下。

(1)将溯源基本问题模型化,并采用合理的概率分布函数来量化有关追踪溯源解(污染源强、发生位置、发生时间)的先验信息量。

(2)在河渠水流水质耦合模拟模型基础上,结合事发现场相关信息及事发水域水文资料,选择和建立合理的似然函数。

(3)基于先验概率分布和似然函数得到追踪溯源解的后验概率分布函数。

对追踪溯源解后验概率分布进行抽样,从而得到突发水污染事件追踪溯源解的估计值。

首先,将将观测数据采集前所有关于未知参数向量θ的先验信息概率分布表述为p(θ)。获取观测数据后,通过贝叶斯推导得到的未知参数的后验分布为p(θ|d),满足

式中:θ代表污染源三参数;d代表污染物浓度测量值。

p(d)是测量值的概率分布,显然p(d)与参数θ无关,实测浓度已知的情况下,p(d)可以理解为取值为1,由此有

式(5.5)中参数θ先验分布p(θ)可以认为是对应参数在先验取值范围内的均匀分布,有

因此,要求出污染源参数后验分布p(θ|d),需先确定分布p(d|θ),可定义为测量值与预测值之间的似然函数(测量值后验分布本质上是围绕真值的误差分布)。令di、Ci(x,t|θ)和p(di|θ)分别为第i个测点的测量值、预测值和似然函数,εi=di-Ci(x,t|θ)为测量误差,i=1,2,…,N。假定误差εi服从均值为0、标准偏差为εi正态分布且每个测量点相互独立,则有

从而可以得到污染源参数后验分布p(θ|d):(www.xing528.com)

然而由于Ci(x,t|θ)比较复杂或模型参数空间和维数都较大,使得p(θ|d)非常抽象并难以直观表示出来,因此直接贝叶斯方法几乎不能直接解决实际问题,依靠马尔可夫链蒙特卡洛方法的使得这种问题得到解决。按照构造马尔可夫链所用转移概率矩阵的不同,MCMC方法的主要抽样算法有:Gibbs抽 样算法、Metropolis-Hastings算法和自适应Metropolis算法,其中自适应Metropolis算法对于θ的任何先验分布都能够收敛于目标分布,因此选用该方法进行抽样。

基于上述推导过程,基于贝叶斯推理和马尔可夫链蒙特卡洛方法的突发污染追踪溯源主要步骤如下:

(1)设定i=0,对不同变量进行初始化

(2)随机变量生成与接受,构造Markov链。

1)产生均匀分布的先验参数θ=θ(m,x0,t0)。

2)由产生的污染源参数,根据第3章方法计算观测点上的浓度值。

3)由式(5.8)计算似然函数p(θ|d)。

4)由下式计算Markov链接受概率。

5)产生一个0~1之间均匀分布的随机数R,若R<α,则接受该次测试参数,取θi+1*,否则保留原有参数θi+1i

(3)重复1)~5)的步骤,直到达到预定迭代次数或获得污染源项参数预设定的后验样本数,然后统计各参数的后验分部规律,完成溯源计算。

从上述过程可看出,概率统计方法很依赖于参数的先验取值范围和计算误差分布信息,而且参数先验范围较大时,采用均匀分布随机生成参数值收敛速度很慢。另外,方法依靠马尔科夫链蒙特卡罗随机抽样实现求解,因未能对已有结果进行择优判断而不具有方向性,也使得溯源效率较低。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈