本书中多版本网络服务模式文件间匹配问题有如下特点: ①模式文件要么由独立的模式片段组成,要么可以分割成一个个独立的模式片段; ②模式文件间的匹配问题与模式片段间匹配问题是相同问题; ③片段间的模式匹配结果组合可以得到两个模式文件间的匹配结果; ④模式片段间没有重叠,不会造成重复匹配操作。所以对多版本网络服务模式文件匹配问题应用分治法思想是可行也是合理的。
当前有许多模式匹配系统涉及基于片断的匹配问题,例如BMO (Hu 和Qu, 2006) 使用一种基于语言学的方法来匹配两个本体产生一个相似值矩阵,接着对相似值矩阵应用一种特殊的分割算法得到直接的块映射。由于匹配是基于两个完全的本体,系统扩展性差,不适合大规模的本体匹配问题。此外,由于算法使用基于语言学的方法来计算两个元素间的相似值,所以匹配质量不是很高。ARTEMIS (Casta-no等,2001) 同样应用一种块匹配思想,它借助Word Net (Miller,1995) 同义词库知识来计算两个模式元素间的语义距离,并对这些映射元素对使用一种聚类算法来生成块映射,该方法的缺点是算法复杂。COMA+ + (Aumueller等,2005) 把每一个本体转换成一个有向无环图并使用一种自顶向下的方法对模式图进行分割。COMA+ +最初是用来分割数据库模式或XML模式,这些模式在匹配系统内部通常表示成树结构。本书在综合分析上述匹配系统特点的基础上,提出了一种基于COMA+ +的片断模式匹配方法。图6-2是基于片段的模式匹配方法结构图。
图6-2 基于片段的模式匹配方法结构图(www.xing528.com)
系统由三个核心部件组成: 模式分割器、片断识别器及模式匹配组件。模式分割器主要功能是采用一种合理的模式文件分割方法把一个大的模式文件分割成几个合适的模式片断。模式分割器是系统的关键组成部分,模式分割方法的好坏直接影响模式匹配结果的质量。片断识别器主要用来发现所有在源模式片断与目的模式片断中的相似片断,以便从细节上对这些模式片断进行匹配。片断识别是系统执行正确片断匹配的重要前提条件。模式匹配组件主要用来实现所有相似模式片断间的匹配,并把所有模式片断间匹配结果进行组合形成两个模式文件完全匹配结果。模式匹配组件是系统的核心执行部件,它可能只包含某种具体的匹配算法,也可能提供各种匹配算法的组合,用户通过用户接口可以选择具体的匹配算法和匹配结果组合方法,它相当于一个独立的模式匹配系统。基于片断的匹配方法包含模式文件解析和分割、相似片段识别、模式片段间匹配及最后的匹配结果组合四个步骤。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。