首页 理论教育 实验结果:模式片断相似值和模式匹配质量评估

实验结果:模式片断相似值和模式匹配质量评估

时间:2023-10-04 理论教育 版权反馈
【摘要】:表6-7 模式片断根节点相似值表6-8 模式片断结构相似值表6-9 模式片断组合相似值图6-13 识别的相似片断2. 模式匹配质量实验我们采用查准率、查全率和全面性 这3项指标来评估基于片断的模式匹配方法质量。

实验结果:模式片断相似值和模式匹配质量评估

1. 模式片断识别实验

a.WCS模式片断识别试验

我们以1.0版本模式文件get Coverage.xsd和1.1版本模式文件wcs Get Coverage.xsd为例,通过片段识别算法首先计算模式片断根元素节点间相似值,计算结果如表6-1所示,候选相似片断的根元素相似值都为1,非相似片断根节点相似值为0。表6-2结果是通过公式 (6-2) 计算得到的模式片断结构相似值。表6-3则是利用公式 (6-3) 计算的模式片断间组合相似值,权系数α在这里取0.6,相似片断门限相似值取0.5。根据表6-3中模式片断相似值得到如图6-11中所示相似片断对应关系,每个片断在图中用根元素表示。

表6-1 模式片断根节点相似值

表6-2 模式片断结构相似值

表6-3 模式片断组合相似值

图6-11 识别的相似片断

b.WFS模式片断识别试验

以模式文件wfs_ xsd和WFS_ basic_ xsd为例,同样应用片段识别算法分别计算出来的模式片断根元素节点间相似值、模式片断结构相似值及模式片断间组合相似值如表6-4,表6-5,表6-6所示。根据表6-6中模式片断相似值得到如图6-12所示相似片断对应关系,每个片断在图中用根元素表示。

表6-4 模式片断根节点相似值

表6-5 模式片断结构相似值

表6-6 模式片断组合相似值

图6-12 识别的相似片断

c.SOS模式片断识别试验

以两种版本模式文件sos Get Capabilities.xsd为例,同样应用片段识别算法分别计算出来的模式片断根元素节点间相似值、模式片断结构相似值及模式片断间组合相似值如表6-7、表6-8和表6-9所示。根据表6-9中模式片断相似值得到如图6-13所示相似片断对应关系,每个片断在图中用根元素表示。

表6-7 模式片断根节点相似值

表6-8 模式片断结构相似值

表6-9 模式片断组合相似值

图6-13 识别的相似片断

2. 模式匹配质量实验

我们采用查准率查全率和全面性 (Ziegler等,2006) 这3项指标来评估基于片断的模式匹配方法质量。

(1) 查准率 (precision): 匹配结果中正确匹配结果占所有匹配结果的比率:

Precision=T/P=T/ (T+F) (6-4)

(2) 查全率 (recall): 匹配结果中正确匹配结果占实际匹配结果的比率:

Recall=T/R (6-5)(www.xing528.com)

(3) 全面性 (overall): 通过使用匹配算法所节省的工作量占总的匹配工作量的比率:

Overall=Recall* (2-1/Precision) (6-6)

其中T为匹配算法返回的正确匹配结果,P为匹配算法返回的所有匹配结果,F为匹配算法返回的错误匹配结果,R为所有正确的匹配结果。

所有匹配试验是统一使用Windows机器上安装的Sun Java 1.6.0库,机器硬件配置为: 3.0GHz Intel Xeon处理器和2.0GB RAM. 对于文中选择的CONTEXT匹配方法,它的组成匹配器为path (路径匹配器),相似值立方体聚合方法是average (平均法),定向方法选择的是both (双向定向法),相似值组合方法是average (平均法),最后的匹配候选者选择方法是多因子法,其值为multiple (0,0.01,0.5),其中多因子三个值分别表示候选者数量 (一般都为0),一个可调参数及门限值 (一般为0.5),对于COMA匹配方法,其组成匹配器包括name,path,leaves ,parent等匹配器。其相似值聚合方法、定向方法、相似值组合方法与CONTEXT相同。匹配候选者选择方法也是多因子方法,其值为multiple (0,0.008,0.5)。

a.WCS模式匹配质量试验

实验选择网络覆盖服务模式1.1版本wcs Get Capabilities.xsd,wcs Get Coverage.xsd, wcs Describe Coverage.xsd作为源模式,选择1.0版本wcs Capabilities.xsd,describe Cover-age.xsd,get Coverage.xsd作为目的模式文件,匹配在: C1: wcs Get Capabilities.xsd与wcs-Capabilities.xsd间; C2: wcs Describe Coverage.xsd与describe Coverage.xsd间; C3: wcs Get-Coverage.xsd与get Coverage.xsd间分别进行。分别使用COMA、CONTEXT和FRAG-BASE (基于片断) 三种方法对两种版本模式进行匹配,选择COMA匹配方法对模式片断进行匹配。从图6-14,6-15,6-16可以看出,对于C1,C2组匹配,基于片断方法在平均查全率,平均精度及全面性等方面是最高的,查全率和精度都在80%以上,从图6-14,6-15, 6-16还可以看出,对于完全模式匹配,如C3组匹配,其查全率,精度和全面性方面明显低于C1,C2组匹配结果。

图6-14 三种方法匹配查全率比较

图6-15 三种方法匹配精度比较

图6-16 三种方法匹配质量总体比较

b.WFS模式匹配质量试验

实验选择网络要素服务模式1.1版本wfs.xsd作为源模式,选择1.0版本WFS-basic、WFS-capabilities、WFS-transaction.xsd作为目的模式文件,分别使用COMA、CONTEXT和FRAG-BASE (基于片断) 三种方法对两种版本模式进行匹配,同样选择COMA匹配方法对模式片断进行匹配。从图6-17、6-18、6-19可以看出,三种方法平均查全率平均精度和全面性都在80%以上,基于片断方法平均查全率,平均精度和全面性达到90%以上,对于基于子模式片断匹配,如模式文件wfs-basic.xsd, wfs-transaction.xsd模式文件的片断匹配,其平均查全率和精度高达100%。从图6-17、6-18、6-19还可以看出,对于完全模式匹配,如wfs-capabilities.xsd,其查全率,全面性方面明显低于基于子模式片断匹配结果。

图6-17 三种方法匹配查全率比较

图6-18 三种方法匹配精度比较

图6-19 三种方法匹配质量总体比较

c.SOS模式匹配质量试验

实验选择传感器观测服务模式1.0.0版本sos Get Capabilities.xsd,sos Get Observation.xsd作为源模式,选择0.0.31版本sos Get Capabilities.xsd,sos Get Observation.xsd作为目的模式文件,分别使用COMA、CONTEXT和FRAG-BASE (基于片断) 三种方法对两种版本模式进行匹配,选择COMA匹配方法对模式片断进行匹配。从图6-20、6-21、6-22可以看出,三种方法平均查全率平均精度和全面性都在80%以上,平均精度达到90%以上,对于模式文件sos Get Observation.xsd间的匹配,三种方法结果都一样且匹配质量高达90%以上。

图6-20 三种方法匹配查全率比较

图6-21 三种方法匹配精度比较

图6-22 三种方法匹配质量总体比较

3. 模式匹配效率实验

为了比较本书提出的基于片断匹配方法在性能上的优势,本书针对WCS,WFS,SOS三种服务类型两种不同版本的服务模式,从在相同的软硬件环境下使用COMA,CON-TEXT,FRAG-BASE三种匹配方法进行匹配,得出的试验结果如图6-23、6-24、6-25所示。从WCS,WFS,SOS模式文件匹配效率结果图可以明显看出,对于相同的网络服务模式间的匹配问题,使用基于片断的匹配方法大大地提高了匹配的性能,对于一个匹配元素数目在100个左右的模式文件而言,使用基于片断匹配方法所花费的时间在几十个毫秒内,在同等条件下,使用基于片断匹配方法所花费时间大约为COMA方法匹配时间的10%~20%,比使用CONTEXT方法也要节约50%~70%的时间。

图6-23 WCS模式不同匹配方法效率比较

图6-24 WFS模式不同匹配方法效率比较

图6-25 SOS模式不同匹配方法效率比较

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈