通过设定min_sup和min_con参数,利用本书3.3节所研究的算法可以自动地生成模糊形式背景中所有满足条件的空间关联规则。但在具体的应用中,只对其中的某些规则感兴趣,并不需要生成所有的规则。一个较好的办法就是利用本书2.4.2中的方法,从模糊背景计算出的E和δ两个参数来提取感兴趣的规则,从而避免生成冗余规则。依据模糊概念格的Hasse图计算节点之间的空间关联规则的方法说明如下:
如果用C1=(m1,n1)和C2=(m2,n2)分别表示用户感兴趣的两个模糊概念格节点。两个节点对应的外延基数分别为,则可以通过节点间的关系计算关联规则的置信度和支持度,从而获取应用中感兴趣的规则。
1.计算支持度的方法
假设f(n)为含有内涵n的对象在数据集D中出现频率的函数。
①对于两个节点如果在Hasse图上有线段相连,则可以认定两个节点之间有直接联系,可以用下式计算支持度:s(n1Rn2)=fr(n1∪n2)/fr(φ),其中fr(n1∪n2)为n1,n2在D中同时出现的频率,fr(φ)其实就等于D的基数,为“空集”内涵属性在D中出现的频率。
②否则就搜索两节点间共同的子节点n3,按下式计算:s(n1Rn2)=fr(n3)/fr(φ)。(www.xing528.com)
2.计算置信度的方法
①对于两个节点如果在Hasse图上有线段相连,则可以认定两个节点之间有直接联系,则n1,n2之间的置信度用下式进行计算:C(n1Rn2)=fr(n1∪n2)/fr(n1)=,其中fr(n1)≠0,fr(n1∪n2)为n1,n2在D中同时出现的频率,fr(n1)为n1在D中出现的频率。如果n2⊆n1,则C(n1Rn2)=1。
②否则就搜索两节点间共同子节点n3,按下式计算C(n1Rn2)=C(n1Rn3)/C(n2Rn3)。
在应用中,首先通过分析设定min_sup和min_con,按照空间关联规则的直接提取算法计算出各节点之间的置信度和支持度,如果均满足设定的阈值,则存在感兴趣的关联规则。
在例2所示的模糊形式背景中,确定每列的隶属度值的阈值(该值可以根据情况确定,研究中确定为0.5),若大于等于此阈值的取原值,生成模糊概念格。对模糊概念格中的每个概念,计算模糊参数值δ值,使得从模糊概念格提取空间关联规则时,可以避免生成非健壮节点对。每个节点的E、δ值见图3-3,设δ的阈值为0.05,则健壮节点为a({1,2},{d1,d3,d5})、b({3},{d1,d4,d5})、d({4,5},{d2,d3,d6,d7})、e({1,2,4,5},{d3})。设置支持度阈值为0.2,置信度阈值为0.025,则节点对(e,a)、(e,d)均为候选二元组,可提取模糊关联规则d3⇒d1d5、d3⇒d2d6、d3⇒d2d7。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。