本部分采用灰色关联度理论和BP神经网络理论对云南省泥石流灾害损失进行了独到的实证研究[13]。首先对云南省泥石流多个致灾因素及灾情数据对直接经济损失的关联度进行分析,筛查对云南省泥石流有重要影响的因素。然后,选取几个对泥石流经济损失有重大影响的因素作为神经网络模型的输入层,对云南省泥石流经济损失进行尝试性测度。鉴于模型会陷入局部最优的缺陷,本文在考虑优化时选择遗传算法,对模型进行全局最优角度的优化,提升模型对云南省泥石流经济损失测度的精确度。最后,基于统计模型的预测评估结果,系统地设计出针对地质灾害的风险管控措施,形成一套适用于云南省的地质灾害风险管控体系。
(1)灰色关联度模型
为找出最为关键的云南省泥石流涉灾因素,本部分将选用基于灰色理论的灰色关联度分析作为甄选最能契合云南省泥石流经济损失的涉灾因素的方法。作为一种简洁新颖的因素分析方式,其原理是基于灰色理论,不同因素按时间顺序排列所成的曲线在形态上有趋同趋势,则因素的发展趋势也趋同,谓之有较强的关联度。这种方法赖其原理简明,适用性佳,在评估与决策工作中得到了广泛好评。这种灰色关联分析基础工具,在量化度量因素关联程度,特别是分析序列发展趋势上,有良好的实证效果。
取X0={x0(k ),k=1,2,…,n}为系统母序列,Xi={xi (k ),k=1,2,…,n}为系统子序列(i=1,2,…,m)。
Δx0i(k )表示于k处x0与xi的位移距离,Δxi (k )与Δ2xi (k )分别表示xi于点k处的速度和加速度,即斜率和二阶斜率。其中|Δx0i(k )|越小,母子序列曲线在i时刻的相似度越高;其中|Δxi (k)-Δx0(k )|越小,母子序列曲线在i时刻的速率发展更趋同;其中|Δ2xi (k)-Δ2x0 (k )|越小,母子序列曲线在i时刻的加速度发展更趋同。由此可定义:
①灰色关联度模型的选取
现有较为成熟而实用的关联度量化的模型主要包含邓氏、T型和改进几类关联度等,这几类关联度中邓氏关联度反应母子序列发展过程是通过计算位移差来实现的,其他几个则是通过计算速率差来实现刻画母子序列曲线变化趋势的相似度。模型具体差别如下:
● 邓氏关联度
设关联系数为ξi (k ),即点k的关联系数为:
其中表示序列x0与序列xi在k点做差的绝对值,用Δi(k )来表示。
关联度用ir表示,其中:
● T型关联度
其中:
● 改进的关联度
其中:。
现有文献表明,几种方法中邓氏关联度最为简明,且其完成度高,应用效果好的特点备受研究人员青睐,故本文将其作为探究云南省泥石流涉灾因素与直接经济损失间关联程度的实证分析工具。
②灰色关联度模型的数据无量纲化处理
在研究泥石流灾害时本文利用的气压、水汽压、降水量以及泥石流直接经济损失等涉灾因素中,各涉灾因素的单位不同,导致涉灾因素从数量上看相差多个数量级,这样的量纲差距无论是对因素间比较的科学性,还是计算结果的准确性而言都会带来严重的不良影响。为此我们理应将各涉灾数据做无量纲处理。本文因部分数据值的初值为0,宜采用均值法做无量纲处理,将序列内每一个数据xi (k )(k=1,…,n)除以均值,得到各涉灾因素的无量纲序列
③关联度的计算
按照灰色关联度的理论,是对系统中系统子序列和母序列计算求解在(i=0,1,2,…,m)时刻关联值的大小来确定序列之间关联程度的大小。关联度ri的计算公式为:
④平均关联度
通过上式(4-31)计算之后,我们得到母子序列的关联度矩阵。为比较子序列的关联程度强弱,我们需要分别计算关联度矩阵中表示子序列的一列关联度数据求其均值,计算出的均值即为平均关联度,用以表示母子序列之间关联程度以及用以对比子序列间孰与母序列关联程度更高。
(2)神经网络模型
①神经网络模型
图4-1 BP神经网络拓扑结构
BP神经网络是一种单向多层信号向前传的前馈式网络,而其误差具有反向传播的结构特性。它由Panl.Wethoss在1974年提出,鉴于其高度灵活性,被广泛改进应用到众多领域。其原理可简概为:对于进入网络的信号,都会始自输入层单向沿路径到隐含层,经其层层处理沿路径传至输出层。这样单向传递的性质可以使一层神经元的状态仅仅影响下一层的神经元。若到达输出层的信号使信号相去甚远,则会将信号转入反向传播路径,以预测误差为依据,改进网络运行中的阈值和权值。凭借不断修正网络的结构特性,将能够使得网络运行结果不断逼近预先设置的期望输出值,提升运行计算输出结果的精确程度,完成对网络的训练,其结构如图4-1所示。由其结构及运行模式不难看出,相较一般线性模型BP网络能够根据误差对自身进行修正,并能记忆行之有效的运行参数,甚至能达到联想记忆的运行效果,是更加智能化的计算模型,其运行效果和实践结果都表明在部分领域其精确度优于线性模型。充分利用BP网络的学习记忆特性对解决非线性问题在计算效率上和结果精确度上都能有更为令人满意的结论。
图4-1中,X1,X2�Xn 为输入信号,即网络的输入值;Y1 ,Y2�Yn为神经网络的输出信号(即预测值);权值包括图中的ωij和ωjk。我们在运用BP神经网络,使用模型运算前不妨视整个网络为非线性函数,输入/输出信号分别视为自变/因变量,按图中变量个数记,则该非线性函数表示n个自变量到m个因变量的函数映射关系。
②神经网络模型的损失测度流程
为构建BP神经网络需要先对网络进行训练,在BP网络具备记忆和联想记忆功能以及具备预测能力后才能使用。训练流程可分为:
● 构建网络:以输入和输出序列( ),X Y个数为依据,分别确定输入/输出层节点数/n m,利用隐含层和输入层之间神经元个数的近似关系,(多次试错法)定下隐含层节点数l,构建初始化隐含层的阈值和输出层的阈值分别为,a b,初始化隐含层和输出层的权值别为ωij和ωjk。
● 计算隐含层输出:利用神经元隐含层激励函数,计算隐含层输出:H(www.xing528.com)
其中:
● 计算输出层的输出。根据隐含层输出,H利用链接权值jkω和阈值b,计算输出层的输出:O
● 预测误差。利用网络计算得出的预测值O和期望值Y计算预测误差:
● 更新权值和阈值。以误差e为依据计算更新链接权值ijω和jkω,阈值a,b;
其中η为学习效率。
● 若(2)~(5)步未能使迭代结束,则返回(2)重复计算,直至迭代运算结束。
③神经网络模型损失测度的缺陷
虽说BP神经网络兼备适用性强,灵活度高的优点,在许多学科的应用过程中有诸多亮眼表现,然受其算法本身局限,在实证应用过程中也有不少固有缺陷有待改进优化,其不完备之处可概括为“三个难以做到”[14]:
一是网络理论难以做到“结构确定”:BP网络理论本身决定了我们难以做到一次就确定最优的隐含层节点数,需要多次试错,才能找出能使网络收敛的最佳结构。
二是网络算法难以做到“又快又准”:BP网络的收敛是通过梯度下降来实现的,未经改进的BP网络在计算时是选用单个随机初始值进行计算,不仅容易陷入局部最优导致结果难以做到精确而且在数据量较大时学习收敛速度慢,甚至在网络训练时可能发生震荡,致使网络不收敛。
三是网络算法难以做到“容错率高”:BP网络对数据的充分性(数量)和适当性(质量)依赖性很强,数据直接能够决定网络训练效果和计算效率,但实证研究中极难对输入层因素选择的准确性做出绝对保证,而在合理保证甄选输入层因素的条件下就需要算法有一定容错能力,这也是BP网络待改进的一个关键。
以上缺陷极大限制和制约了BP神经网络的应用,为解决以上问题,多年来众多学者前赴后继从多角度、多方法对其进行过改进,而遗传算法(GA)是这些方法中效果好,针对性强的优化途径,鉴于此,本文选用GA改进BP网络并进行实证分析。
④遗传算法基本理论
GA算法,也就是遗传算法,由Bagley.J.D在1967年提出。后经密歇根大学的J. H.Holland进行了系统地研究,将自然法则与人工系统算法相结合,成为该理论的奠基石。现在遗传算法这种经由自然界“物竞天择”法则启发而来的全局最优算法已经逐步由理论研究向实证应用实现过渡,并在面部识别、神经网络、智能算法、生物科学、社会科学等方面均有过运用实例。GABP算法的流程图如图 4-2所示。下面从BP神经网络的角度介绍遗传算法的实现[15]:
● 种群初始化:由于遗传算法(GA)不能直接对问题空间的参数进行处理,就需要将可行解编码成为遗传空间的染色体或个体。考虑到云南省泥石流灾害数据的性质可以使用二进制编码进行运输,且运行结果较好,本文在云南省泥石流数据种群初始化过程中选用二进制编码。
● 适应度函数:本文对研究结果的期望是尽量减小测度误差,故BP网络的预测值应当与实际值的差尽量小,故选择预测值与实际值的误差矩阵的范数作为目标函数的输出。其中所用到的排序的适应度分配函数为:
其中obj为目标函数的输出。
● 选择:该操作是在一定概率下将个体选出,组成新的种群,为交叉操作的繁衍过程做准备。而被选择的概率取决于适应度的大小,高适应度个体则有较高概率被选择。由于泥石流经济损失的特性在现有文献中并没有明确最优的选择操作方法,故本文选择采用随机遍历法。
● 交叉:本步操作是将种群中选出的两个不同位置个体交换染色体,将父串强适应特征遗传给子串,从而产生强适应性的新个体。在实数编码的条件下,选择实数交叉法将染色体ka和染色体在ja位进行交叉的方法如下:
其中b为[0,1]的随机数。
● 变异:变异操作是为保证种群多样性所进行的操作,目的是为产生更能匹配目标值的个体选取。若想要变异第i个个体的第j个基因则可以:
其中,r2为的一随机数,g为当前迭代次数,Gmax为最大进化次数。
● 收敛:当最优个体的阈值达到要求或其和群体的适应度都无法再得到提升时计算结果收敛结束,否则新群体将再从选择步骤开始,依次循环直至收敛得到BP网络经优化的权值和阈值。
⑤遗传算法对模型优化效果的概述
考虑到BP网络从单个初值开始迭代计算的特点导致其陷入局部最优,GA算法是以数集串为基础进行搜索,针对性地解决了全局寻优难题。
GA算法在应用的时候需要将数串编码,通过利用经编码后的数串的适应度来对信息进行全局搜索,相比网络需要的信息量要少得多。
图4-2 GABP算法流程
BP网络对数据的充分性和适当性都有较高的要求,但GA算法的“选交变”三步可以快速将数串中与最优解差距大的串筛除,极大提高了计算的容错能力。
以上优化都极有针对性地直指BP神经网络的大部分缺陷,对改进BP网络提升网络测度准确度有极大的帮助。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。