首页 理论教育 在线智能告警分析的研究优化

在线智能告警分析的研究优化

时间:2023-06-28 理论教育 版权反馈
【摘要】:正向推理用于断言那些与知识库中规则的前提相匹配的事实,并用找到的事实,进一步推断出新的事实。正向推理的主要缺点是在求解的过程中许多操作与问题求解无关,目标性不强,这样会造成系统的效率低,具有盲目性。正向推理的最大优点是系统能对用户输入的信息做出快速反应。冲突消解的任务对正向推理和反向推理各不一样,在正向推理过程中,冲突消解将决定选择某一组事实来激活知识库中的某一条规则。

在线智能告警分析的研究优化

传统AVC在告警和异常出现时只是给出告警或异常信息的结果并未给出产生告警或异常的原因,导致了用户无法及时准确的定位这些问题产生的原因,给用户处理一些极端情况带来困难。针对这种情况,如果能对告警和异常的原因实时准确地给出问题的演推过程,则能对一些异常问题采取及时有效的解决方法保证电网更加安全稳定运行。

1.基于推理机的在线告警组合方式研究

(1)推理机简介

推理机是专家系统中的重要组成部分,它实现了专家系统中对知识的推理,利用专家的经验知识,用一定的推理方法,推出结果。推理机构以某种推理策略,在知识库中选择适用的知识,再根据用户提供的问题进行推理,得到用户需要的结论。推理就是不断改变工作存储器的过程,从已知的事实出发,通过与专家知识的匹配,把适用的专家知识找出来,取其后件,然后将后件放入工作存储器中,继续匹配。当然由于对问题的了解不足,又会要求用户输入一些对问题求解有帮助的数据,直到找到最终解。其推理过程如图5-6所示。推理控制是对知识的选择,它直接决定着系统推理的效果和效率

978-7-111-39210-1-Chapter05-28.jpg

图5-6 推理过程示意图

(2)推理机控制策略的研究

推理的控制策略是求解问题时所使用的策略,它决定了求解问题的质量和求解问题的效率,主要由冲突消解策略和推理方向两部分构成。

1)推理方向研究。

推理方向可以分为正向推理、反向推理、混合推理和双向推理四种,它确定了推理时所采用什么样的驱动方式。当然既然要推理,首先就得要求系统要有知识库用来存放专家知识,一个数据库来存放初始已知事实和问题状态,还需要一个对专家知识进行推理的推理机。下面详细介绍这四种推理方向。

①正向推理。

正向推理用于断言那些与知识库中规则的前提相匹配的事实,并用找到的事实,进一步推断出新的事实。正向推理是从已知的信息出发,在知识库中选择合适的知识,然后将所选择的知识构成知识集,接着从知识集中选择一条知识,继续推理,将推出的结果作为继续推理的条件,如此反复,直到求出解为止。正向推理的详细处理过程如下:

a)通过判断断言一个事实,并送入数据库中;

b)使已经断言的事实与知识库中某个规则的前提按某种算法匹配;

c)将事实与前提进行合一替换;

d)将替换应用于规则的后件,即结论;

e)断言结果,并将其送入数据库中,应用于进一步的推理;

f)重复a)~e)步直到推出结果或知识库中再无可适用的知识为止。

正向推理算法如图5-7所示。

正向推理的主要缺点是在求解的过程中许多操作与问题求解无关,目标性不强,这样会造成系统的效率低,具有盲目性。在推理过程中,会推出一些与用户不相关的东西,这样推理的效率就会降低,不利于开发。正向推理的最大优点是系统能对用户输入的信息做出快速反应。正向推理中有一项重要工作就是在推理过程中要从知识库中选择可用的知识,而这就需要将知识库中的知识与数据库中的事实进行匹配,而匹配的问题是一个既复杂又重要的环节。

②反向推理。

反向推理是以某个假设目标作为出发点的一种推理,用于判断用户查询一个事实是否为真,利用存在的一条规则,从知识库中的已知信息来判断查询。反向推理首先提出假设,然后判断所提出的假设是否是一个原始数据,依次检查相关知识是否可用,查看该知识应用的必要条件是否满足。这些必要条件要么已经满足,要么作为新的子目标再用上面的方法继续寻找相关知识,直到求出问题的解为止。反向推理的详细处理过程如下:

a)提出要证明的假设;

b)看该目标是否已经在已有的数据库中,看该目标是否成立;

978-7-111-39210-1-Chapter05-29.jpg

图5-7 正向推理算法

c)查看该目标是不是证据,并做出判断;

d)从知识库中找出能推导出该目标的知识,然后由找出的知识形成知识集;

e)从知识集中选择一条知识,将选出的知识作为下一次的假设目标,然后到第二步,如此反复,直到求出解为止。

反向推理算法如图5-8所示。反向推理的主要缺点是盲目地对初始目标的选择,并不像正向推理那样能充分利用用户提供的信息;其主要优点是反向推理对知识的使用目标性极强,与目标无关的知识不必使用。

③ 混合推理。

针对正向推理在推理过程中目标性不强和反向推理在推理过程中盲目地选择目标的各自缺点,混合推理在一定程度上综合利用正向推理和反向推理的各自优点,取长补短。混合推理一般为了选择初始目标,先用正向推理从初始事实中推导出部分结果,根据此结果选择一个目标,然后为求解该目标,用反向推理得到更多用户提供的信息,然后再用正向推理,可以求得的目标更接近,如此反复直到求出问题的解。混合推理分为两种情况:一种推理过程是先正向推理后反向推理的方法;另一种推理过程如图5-9所示是一种先反向推理后正向推理的方法。

混合推理的主要优点是综合了正向推理和反向推理各自的优点,整个求解的过程更容易理解。这种推理方式主要用于下面几种问题的求解:当工作存储器的初始事实不够,通过正向推理方式并不能满足知识库中任何一条规则的前件;通过初始条件看能不能查看其他存在的结论;在通过正向推理得出的结论可信度达不到期望效果的时候,利用反向推理来提高推理结果的可信度。其主要缺点是相比正、反向推理的控制策略更加复杂。混合推理一般用于求解复杂问题。

978-7-111-39210-1-Chapter05-30.jpg

图5-8 反向推理算法

④ 双向推理。

双向推理控制策略是正向推理和反向推理的结合,这种推理方法改善正向推理不一定达到目标和通过反向推理不能推至初始事实的缺点,双向推理的成功就是能找到正向推理得出的中间结果满足反向推理的数据要求。但双向推理较难实现,原因主要有两点:一是怎样才能找到正向推理与反向推理结合点的问题;二是怎样才能很好判断结合问题,也就是如何利用正向推理的中间结果去判断某个总体目标是否被满足,这是一个非常难解决的问题。由于上面的原因,在一般的专家系统的设计过程,使用双向推理策略的不多。

978-7-111-39210-1-Chapter05-31.jpg

图5-9 混合推理算法

2)冲突消除策略。

冲突消解策略解决的问题是,从多条可用知识中按某种方法选择一条知识。冲突消解策略即执行冲突消解过程所依据的原则。冲突消解的任务对正向推理和反向推理各不一样,在正向推理过程中,冲突消解将决定选择某一组事实来激活知识库中的某一条规则。在反向推理过程中,冲突消解将决定某一假设与知识库中某一规则后件进行匹配,根据此规则推出相应的前件作为新假设。比较常用的冲突消解策略有

① 按规则可信度或权威性排序。可信度大或权威性高的规则优先执行。

② 按规则的针对性排序。选择要求条件较多的知识,可以得到更具针对性和可靠性的推理结果。

③ 按就近原则排序。把最近使用的知识作一个标记,作为最高优先级

④ 具有有效数据驱动的规则优先执行。事实的有效性可根据启发式函数来衡量。

⑤ 按知识库中知识的顺序排序。以知识在知识库中的顺序决定优先级。

⑥ 数据冗余限制。当一条知识的操作产生冗余事实时,则这条知识的优先级降低,冗余事实越多,优先级越低,如果产生的事实全部为冗余事实时,则这条知识为不可用知识。冲突消解策略是一个基本控制策略,在以上所介绍的其他控制策略中,往往都涉及冲突消解策略。

(3)基于推理机的在线告警组合方式的研究

通过推理机的分析和推理,我们可以将一些告警和异常信息通过的推理策略进行问题推理和还原。主要可以进行以下一些问题的推理。

1)异常和告警的推理功能。

通过对异常事件的反向推理和分析,完成对异常信息的推理得到问题产生的全过程,使得运行人员及时发现问题。例如:

通信异常告警情况。

某站通信异常→AVC系统未收到遥测返回报文→厂站端无遥测报文返回→AVC已发送遥测召唤命令。

② 通道异常告警情况。

某站通道异常→ping命令返回false→AVC尝试向厂站发送Ping命令。

③ 设备失败闭锁告警情况。

设备失败闭锁告警→17:26开始闭锁时间20min→17:15~17:25连续调节3次失败→17:25第三次调节失败→17:20第二次调节失败→17:15第一次调节失败→某电容器投入。

2)控制命令的推理功能。

对一些系统不发令或无法调节的特殊情况做出系统发令的解释,验证系统控制的正确性。

① 电压越限告警系统无命令的情况。

母线电压越下限→上级厂站已无调节手段→本站AVC已无调节手段→档位调节已经超过限制→补偿设备已投。

② 电压越限系统控制命令的情况。

某母线电压越上限→上级厂站1#变压器档位由3变为2档→本站AVC已无调节手段→档位调节已经超过限制→补偿设备未投入。

3)自学习推理和分类功能。

智能告警和异常信息分类功能是指对告警和异常信息进行按是否可以由智能AVC系统控制的操作类型来分类:一类是智能系统自己可以自动解决异常信息,比如AVC闭锁设备、连续调节不成功、档位已经达到调节次数等;另外一类是系统没办法自己解决的,比如电压越限无调节手段等。自学习推理功能就是在对可由智能AVC系统自动解决的这部分信息中通过推理来自学习类似场景下的模糊推理,通过模糊推理来确定如何解决这些异常信息。

2.基于关联规则和范例推理的在线告警关联分析及求解研究

电力系统AVC系统在线告警信息复杂多样,很多时候很难通过观察来发现一些隐含的问题和联系。本节通过关联规则的研究提出对告警和异常进行关联分析,同时对分析后的结果通过范例推理进行告警事故的决策

(1)关联规则研究

1)关联规则简介。

关联规则挖掘发现大量数据中项集之间有趣的关联或相关联系。随着大量数据不停的收集和存储,许多业内人士对于从他们的数据库中挖掘关联规则越来越感兴趣。从大量商务事务记录中发现有趣的关联关系,可以帮助许多商务决策的制定,如分类设计、交叉购物。

关联规则挖掘的一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。例如,在同一次去超级市场,如果顾客购买牛奶,他也购买面包(和什么类型的面包)的可能有多大?通过帮助零售商有选择地经销和安排货架,这种信息可以引导销售。例如,将牛奶和面包尽可能地放近一些,可以进一步刺激一次去商店同时购买这些商品。

数据是事务的或关系的,如何由大量的数据中发现关联规则?什么样的关联规则最有趣?如何帮助或指导挖掘过程发现有趣的关联规则?对于关联规则挖掘,什么样的语言结构对于定义关联挖掘查询是有用的?下面我们通过对关联规则的产生来了解一下关联规则的主要内容。数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database),在最近几年里已被数据库界所广泛研究,其中关联规则(Association Rules)的挖掘是一个重要的问题。关联规则是发现交易数据库中不同商品(项)之间的联系,这些规则找出顾客购买行为模式,如购买了某一商品对购买其他商品的影响。发现这样的规则可以应用于商品货架设计、货存安排以及根据购买模式对用户进行分类。

Agrawal等人于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。他们的工作包括对原有的算法进行优化,如引入随机采样、并行的思想等,以提高算法挖掘规则的效率,并对关联规则的应用进行推广。

2)基本概念和问题描述。

I={i1i2,…,im}是二进制文字的集合,其中的元素称为项(item)。设D为交易(transaction)T的集合,这里交易T是项的集合,并且TI。对应每一个交易有唯一的标识,如交易号,记作TID。设X是一个I中项的集合,如果XT,那么称交易T包含X

一个关联规则是形如XY的蕴涵式,这里XIYI,并且XY=Φ。规则XY在交易数据库D中的支持度(support)是交易集中包含XY的交易数与所有交易数之比,记为support(XY),即

support(XY)=|{TXYTTD}|/D

规则XY在交易集中的可信度(confidence)是指包含XY的交易数与包含X的交易数之比,记为confidence(XY),即

confidence(XY)=|{TXYT,T∈D}|/|{TXTTD}|

给定一个交易集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度(minsupp)和最小可信度(minconf)的关联规则。

3)关联规则的种类。

我们将关联规则按不同的情况进行分类:

① 基于规则中处理的变量的类别,关联规则可以分为布尔型和数值型。

布尔型关联规则处理的值都是离散的、种类化的,它显示了这些变量之间的关系;而数值型关联规则可以和多维关联或多层关联规则结合起来,对数值型字段进行处理,将其进行动态的分割,或者直接对原始的数据进行处理,当然数值型关联规则中也可以包含种类变量。

② 基于规则中数据的抽象层次,可以分为单层关联规则和多层关联规则。

在单层的关联规则中,所有的变量都没有考虑到现实的数据是具有多个不同的层次的;而在多层的关联规则中,对数据的多层性已经进行了充分的考虑。

③ 基于规则中涉及的数据的维数,关联规则可以分为单维的和多维的。

在单维的关联规则中,只涉及数据的一个维,如用户购买的物品;而在多维的关联规则中,要处理的数据将会涉及多个维。换成另一句话,单维关联规则是处理单个属性中的一些关系;多维关联规则是处理各个属性之间的某些关系。给出了关联规则的分类之后,在下面的分析过程中,就可以考虑某个具体的方法适用于哪一类规则的挖掘,某类规则又可以用哪些不同的方法进行处理。

4)关联规则价值衡量方法。

当我们用数据挖掘的算法得出了一些结果之后,数据挖掘系统如何知道哪些规则对于用户来说是有用的、有价值的?这里有两个层面,即用户主观的层面和系统客观的层面。

① 系统客观层面。

很多的算法都使用“支持度-可信度”的框架。这样的结构有时会产生一些错误的结果。于是人们引入了兴趣度,用来修剪无趣的规则,即避免生成“错觉”的关联规则。一般一条规则的兴趣度是在基于统计独立性假设下真正的强度与期望的强度之比。然而在许多应用中已发现,只要人们仍把支持度作为最初的项集产生的主要决定因素,那么要么把支持度设得足够低以使得不丢失任何有意义的规则,要么冒丢失一些重要规则的风险。对前一种情形计算效率是个问题,而后一种情形则有可能丢失从用户观点来看是有意义的规则的问题。

有研究者给出了感兴趣的规则的定义(R-interesting),之后他们又对此作了改进,把事件依赖性的统计定义扩展到兴趣度的定义上来,并定义了否定关联规则的兴趣度。

除了把兴趣度作为修剪无价值规则的工具,现在已有许多其他的工作来重新认识项集,如Brin等考虑的相关规则。在讨论了蕴涵规则(implication rule),规则的蕴涵强度在[0,∞]之间变化,其中蕴涵强度为1表示完全无关的规则,∞表示完备的规则,如果蕴涵强度大于1则表示更大的期望存在性。

另一个度量值——“收集强度”(collective strength),设想使用“大于期望值”来发现有意义的关联规则。项集的“收集强度”是[0,∞]之间的一个数值,其中0表示完备的否定相关性,而值∞表示完备的正相关性。

② 用户主观层面。

上面的讨论只是基于系统方面的考虑,但是一个规则的有用与否最终取决于用户的感觉。只有用户可以决定规则的有效性、可行性。所以我们应该将用户的需求和系统更加紧密地结合起来。

可以采用一种基于约束(constraint-based)的挖掘。具体约束的内容可以有

a)数据约束。用户可以指定对哪些数据进行挖掘,而不一定是全部的数据。

b)指定挖掘的维和层次。用户可以指定对数据哪些维以及这些维上的哪些层次进行挖掘。

c)规则约束。可以指定哪些类型的规则是我们所需要的。引入一个模板(template)的概念,用户使用它来确定哪些规则是令人感兴趣的而哪些则不然。如果一条规则匹配一个包含的模板(inclusive template),则是令人感兴趣的;如果一条规则匹配一个限制的模板(rextrictive template),则被认为是缺乏兴趣的。(www.xing528.com)

其中有些条件可以和算法紧密的结合,从而既提高了效率,又使挖掘的目的更加的明确化了。其他的方法还有:

Kleinberg等人的工作是希望建立一套理论来判断所得模式的价值。他们认为这个问题仅能在微观经济学框架里被解决,他们的模型提出了一个可以发展的方向。他们引入并研究了一个新的优化问题——分段(Segmentation)问题,这个框架包含了一些标准的组合分类问题。这个模型根据基本的目标函数,对“被挖掘的数据”的价值提供一个特殊的算法的视角,显示了从这方面导出的具体的优化问题的广泛的应用领域

Korn等就利用猜测误差(这里他们使用“均方根”来定义)来作为一些从给定的数据集所发现规则的“好处”(goodness)的度量,他们所定义的比例规则就是如下顾客大多数分别花费1∶2∶5的钱在面包、牛奶、奶油上,通过确定未知的(等价的、被隐藏的或丢失的)值,比例规则可以用来做决策支持。如果数据点线性地相关的话,那么比例规则能达到更紧凑的描述,即关联规则更好地描述了相关性。

(2)横向和纵向告警分析功能

通过以上关联分析的简要介绍,如果可以对目前告警和异常信息进行横向和纵向的关联分析,得到在线的分析结果,那么必将有助于运行人员综合判断问题的性质和找出解决问题的最佳方法。

1)纵向关联异常分析内容研究。

对告警进行纵向异常关联性分析主要是通过关联分析找出一些反复出现的异常信息或不规则出现的现象,通过分析这些现象找到一些隐含的诱因。其主要分析内容如下:

① 遥测异常纵向关联分析;

② 遥信异常纵向关联分析;

③ 滑档异常纵向关联分析;

④ 控制失败异常纵向关联分析;

⑤ 通道连接异常纵向关联分析。

2)横向关联异常分析内容研究。

对告警信息进行横向异常关联性分析主要是通过关联分析找出一些异常信息与不同类异常信息之间的关系,通过分析这些现象找到一些异常信息之间的潜在内在联系。其主要分析内容如下:

① 数据异常与算法收敛间的横向异常关联性分析;

② 不同告警间的横向异常关联性分析;

③ 用户操作对系统稳定性横向异常关联性分析。

3)基于范例推理的理论基础研究。

范例推理既是人类推理的一种重要形式,也是人工智能研究中的一种范式。它不同于通过链式推理产生问题结论的基于规则的推理,是一种基于过去实际经验或经历的推理。该方法的思路非常简单,当预测未来情况或进行决策时,基于范例的推理首先寻找是否存在一个同样的训练范例。如果找到一个,则返回附于该范例上的解。如果找不到同样的范例,则系统将寻找与现有情况最相类似的训练范例,并选择最佳的相同的解决方案。范例推理中的知识表示是以范例为基础的,范例的获取比规则获取要容易,从而大大简化了知识的获取。对过去的求解结果进行复用,而不是再次重新推导,可以提高对新问题的求解效率。过去求解成功或失败的经历可以指导当前求解时该怎样走向成功或避开失败,从而改善求解的质量;对于那些目前没有或根本不存在的,可以通过计算推导来解决的问题(如法律中的判例),范例推理也特别适用。范例推理方法已被广泛应用于医疗诊断、法律、电路或机械设计故障诊断农业气象软件工程等各个领域,并获得了良好的效果。

① 范例推理概述。

认知科学理论的启示和支撑下,美国耶鲁大学RogerShank于1982首次提出了CBR理论的认知模型及框架。之后,Kolodner和她的学生以此为基础,开发出了CBR系统。从此,CBR理论突破了认知科学的理论框架,开始走向人工智能领域的研究和应用。同人类的思维和处理问题模式一样,CBR系统首先通过对比问题范例与先前范例的相似性,来决定选择以前的哪一个或哪一些范例,并修改或修正以前问题的解法。在这一点上,与其他的人工智能解决问题的方法(如专家系统利用领域内通用的启发性知识和规则,通过逐步的推导,得出问题的解)截然不同。而且更重要的是CBR系统固有的属性,它采用增量式的学习方法(新的解决问题的方法和问题范例一同被系统记录并存储起来,以备将来之用),使系统的学习能力不断提高,知识和经验也不断增加。一个完整的CBR系统一般包括几个循环过程,有时称为CBR的生命周期,如图5-10所示。

a)检索:根据输入待解决的问题的有关信息,从范例库中检索相似的范例集。

b)重用:从检索到的一组范例中获得求解方案,判别是否符合要求,若符合,则重用这些方案,否则需要修正。

c)修正范例:从相似范例中修正求解方案,使之适合于求解当前问题,得到当前问题的新求解方案。

d)保存范例:将新范例及其解根据一定的策略存入范例库中,这是CBR的学习方式。

978-7-111-39210-1-Chapter05-32.jpg

图5-10 CBR工作过程

范例推理方法已被广泛应用于医疗诊断、法律、电路或机械设计、故障诊断、农业、气象、软件工程等各个领域,并获得了良好的效果。

②互信息理论

互信息理论来源与数据挖掘中模糊粗糙集的概念(这里对模糊粗糙集不再做详细说明)。使用模糊粗糙集方法时,需要了解一定的领域知识,比如模糊隶属函数的确定等。在某些情况下,这种先验知识是缺乏的,此时我们可以使用互信息方法来进行替代。互信息(Mutual Information)是信息理论中用来表示变量间相关程度的一个基本概念。假设随机变量XY,则互信息IXY)可以定义为

IXY)=HX)+HY)-HXY) (5-28)

式中,H(·)表示·的信息熵。互信息的定义还可以写为

IXY)=HX)-HXY)=HY)-HXY) (5-29)上式表示出了由于知道了属性XY)而减小的关于属性YX)的不确定度,也即互信息表征了属性XY)对属性YX)的贡献。在式(5-28)中,对于离散变量互信息的计算是很简单的,但是连续变量的互信息计算则比较复杂。

散变量互信息的计算是很简单的,但是连续变量的互信息计算则比较复杂。在本文中采用一种简便而准确的互信息估算方法来计算互信息。互信息的概念可以扩展到包括更多变量,矢量X1X2,…Xn)和输出Y之间的联合互信息(Joint Mu-tual Information,JMI)的定义为

978-7-111-39210-1-Chapter05-33.jpg

JMI描述了由特征矢量(X1X2,…Xn)而导致的Y的不确定度减少,即表示了特征矢量对Y的贡献。因为不是所有的特征矢量属性都对输出有贡献,而且各个属性的贡献也是不同的,所以通过选择与输出变量互信息最大的属性子集,可以得到一个对输出属性贡献最大的属性集。

属性∀{a}∈S重要性定义为

γa}=(ISY)-IS\{a};Y))/ISY) (5-31)

基于互信息的属性选择算法描述如下:

a)F←(X1X2,…Xn),S←{⌀};

b)对所有X1F,计算IXiY);

978-7-111-39210-1-Chapter05-34.jpg

d)对所有X1F,计算IXiSY),令δ=ISY);

978-7-111-39210-1-Chapter05-35.jpg

f)若(ISY)-δ)>0,返回d);否则SS\{Xj

g)输出属性子集S和属性重要性γ

自组织映射。

自组织映射(SOM)神经网络由输入层和输出层组成,输入层的每个神经元都通过权值与输出层的每一个神经元相连接,输出层的神经元一般是以二维形式排列的,输出层神经元之间通过许多局部连接形成广泛连接,如图5-11所示。SOM网络自组织学习的基本原理为对于网络的每个输入模式,调整一部分网络的连接权值,使权值矢量更加接近或偏离输入矢量,该调整过程即为竞争学习过程。通过学习,所有权值矢量在输入矢量空间中相互分离,形成各自代表的输入模式,实现特征自动识别的聚类分析功能。

978-7-111-39210-1-Chapter05-36.jpg

图5-11 SOM网络结构图

假设网络输入层有n个神经元,输出层有m个神经元,SOM的学习算法描述如下:

a)网络初始化。给连接权玛、学习速率η(0)和邻域nj(0)赋值

b)提供新的输入。输入矢量为X=(x1t),x2t),x3t)…,xnt)),其中xit)为时刻t输入层神经元i的状态。

c)计算距离。计算输入模式与各输出神经元j间的距离di

978-7-111-39210-1-Chapter05-37.jpg

d)选择与输入模式距离最小的输出层神经元,假设该神经元用j·表示。

e)修改神经元j·以及j·的邻域Nj·(t)内各神经元的权值,按下式进行:

978-7-111-39210-1-Chapter05-38.jpg

其中,jNj·(t),1≤jn,0<ηt)<1

f)转b),重复之。

SOM方法的主要优点有:对输入数据有聚类的作用,并且可以用聚类中心代表原输入,起到数据压缩的作用;保持拓扑有序性,输入中特性相似的点映射后在空间上是邻近的;分布密度匹配,原数据分布密的区域在映射图上对应的区域也较大,分布稀疏的对应区域也较小,从而可以提高分辨率。因此在本节中采用SOM方法进行聚类分析。

4)基于混合知识推理的告警解除方法研究。

基于范例的推理就是充分利用以前的经验来进行推理,求解新问题的过程。本节针对告警或异常事故的重复性以及随机性等特点,提出了基于混合知识推理的方法来进行告警事故自动排除。该方法将范例推理、自组织映射以及互信息理论进行了有效的结合。首先使用互信息理论确定了范例的表示、组织方法;然后通过使用自组织映射将历史范例进行聚类:先将新问题所对应的范例与各个聚类中心进行匹配,得到最相似聚类,然后再在该聚类中进行二次匹配,最后将得到的最相似范例集进行重用、校正,得到最终预测结果。使用互信息方法可以进行范例属性和匹配权重的合理选择,同时使用自组织映射对历史范例进行聚类,可以减少范例匹配次数、减少匹配时间。使用本节方法不仅可以合理利用历史范例,而且还可以通过属性选取、聚类而获取附加知识。

① 基于互信信息理论的范例表示方法。

范例库是CBR中最重要的一个部分,范例内容一般有如下两个主要组成部分:问题或情景描述,即范例发生时要解决的问题以及周围环境的状态;对问题的解决方案。在本书中的CBR系统中,基本范例是由问题的一系列特征属性组成的特征矢量和问题解矢量所组成的。一个典型的负荷范例可以定义为一个二元组,即

Ci=〈pisi〉 (5-34)

式中,Pi={ai1ai1,…,ain}是一个非空有限集合,表示与告警或异常信息相关的描述信息,包括日期类型、异常类型、设备类型等;si气表示解决方案。一个范例库可以表示为

Ci={C1C2,…,Cm} (5-35)

范例的特征项权重对检索的质量与速度有着至关重要的作用,特征项的权重体现了不同的特征具有不同的重要性。在本节我们采用杭州地区2000年度每日的负荷、气象相关数据,以日负荷预测为例,引入互信息理论来确定与待决策相关的各个属性的重要度(见表5-1)。具体过程如下:

表5-1 属性重要度表

978-7-111-39210-1-Chapter05-39.jpg

首先,将日期、有功值、无功值等相关的各个因素列出作为条件属性,将待求的告警排除方案作为特征属性,然后按照互信计算公式进行处理。

IXY)=HX)+HY)-HXY) (5-36)

式中,XY为随机变量;H(·)表示·的信息熵。分别计算各个条件属性与特征属性之间的互信息,并将其作为各个范例属性的重要度指标,结果如图5-12所示。

978-7-111-39210-1-Chapter05-40.jpg

图5-12 各个属性互信息(权重)

范例知识的表示不仅要使知识成为有结构、有组织的体系,还要保证知识易于检索、存取和学习。目前,在知识系统中较多采用的是产生式、语义网络法、框架法、面向对象等诸多表示方法。产生式表示法又称产生式规则表示法,是一种称为Post机的计算模型,模型中的每条规则称为一个产生式。它的优点是采用直观、自然的因果关系表达知识,便于进行推理;易于模块化处理;可表示不确定知识、启发式知识、过程性知识;格式清晰,便于设计、检测。它的缺点是规则库庞大导致工作效率不高,不能表达具有结构性的知识。语义网络法是通过概念及其语义关系来表达知识的一种网络图。它的优点是能直观表示结构化的知识,便于理解,有联想性。它的缺点是缺乏严格的表示体系,处理比较复杂。框架表示法是以框架理论为基础发展起来的一种结构化的知识表示方法,主要用于描述事物的内部结构以及事物间的类属关系。它的优点是易于表达结构性知识,具有可继承性、自然性,便于理解。其缺点是不利于表达过程性知识。在面向对象的方法中,类、子类、具体对象构成了一个层次结构,而且具有继承性。它的特点是具有面向对象的优势,具有模块性、继承性和多态性。

② 范例的检索与匹配。

范例检索是利用范例库的索引机制,根据范例相似性度量方法,从范例库中找到与当前求解问题最相似的一个范例(或范例集)。如图5-13所示,在本书中首先使用SOM对范例库中的历史范例进行聚类分析,从而得到反映数据特征的各个聚类以及聚类中心。然后让新问题所对应的新范例与各个聚类中心进行比较,从而得到新范例所属的聚类,然后再在该聚类中寻找同新范例最相似的历史范例。其步骤如下:

a)将新问题转化为新的范例。

b)使用SOM对范例库中的历史范例进行聚类分析,并得到各个聚类的中心。

978-7-111-39210-1-Chapter05-41.jpg

图5-13 SOM-CBR工作过程

c)将新范例各个属性值与各个聚类中心点各属性值进行比较,使用k-最近邻域法确认与新范例最接近的一个聚类。k-最近邻法是CBR系统中定义相似性的一类重要且基本的方法。范例是由n个数值属性所描述。每个范例代表n维空间中的一个点,这样所有的范例就被存放在n维空间中。当给定一个新对象时,一个k最近邻分类器就搜索n维空间,并从中找出k个与未知对象最为接近的范例,这k个范例就是未知对象的“k个最近邻”。所谓最近就是指n维空间中两点之间的欧氏距离最小,而n维空间中两点X={x1x2,…,xn}和Y={y1y2,…,yn}之间的欧氏距离为

978-7-111-39210-1-Chapter05-42.jpg

实际上范例的相似性匹配包括两个步骤,即根据范例特征值的描述,评估新范例和旧范例各特征之间的相似性;根据相似性匹配函数,评估新范例和旧范例的综合相似度。

Ca={f1f2,…,fn}为新范例,fi为范例的属性,I=1~nCb={a1a2,…,an}为范例库中的历史范例,aj为历史范例的属性,j=1~n。范例的相似度为

978-7-111-39210-1-Chapter05-43.jpg

式中,wk为范例特征矢量中第k个特征的权重;Rk表示第k个特征的取值范围。根据式(5-38)可以计算得到范例库中k个与新范例最相似的历史范例。在本节中,各个特征的权重选取可根据图5-12得到的属性重要性确定。

d)在上面得到的聚类中再次利用k-最近邻域法,从而得到在该聚类中与新范例最匹配的历史范例集。

e)用得到的历史范例集进行范例的重用、修正,得到新的求解方案。

f)将新范例及其结果存入范例库中。

③ 范例重用。

可采用最相似聚类中的最相似范例集进行重用,选取相似度为性能指标,其定义为

978-7-111-39210-1-Chapter05-44.jpg

式中,Δδ表示相识度;Tv表示求解范例条件实际加权值;Th表示历史范例条件实际加权值。

④ 校正。

在对告警信息的排除方案中,部分方案可能会影响到电网的控制和潮流的变换,所以在排除方案形成后,需要根据当前电网的情况加入在线校正的计算,并用潮流计算和对一些硬约束条件的判断,保证在该方案下,电网无新的异常情况产生。

⑤ 新范例的存储。

进行一次新的预测后,按照范例的表示方式将其组织成新范例,并根据索引机制存入范例库中。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈