目前,本体的思想和方法已经被广泛应用到特定领域知识的描述和组织中。而将本体和推理结合起来表现具体领域中显式知识和蕴涵知识的研究却刚刚起步。在国家自然科学基金资助项目“基于本体的数字图书馆检索模型研究”的研究中,我们应用本体思想和方法组织“国共合作”的人文史料,利用本体的语义描述能力与推理能力表现这个历史领域错综复杂的人文事件。由于“国共合作”历史具有历史跨度时间长(将近一个世纪),信息量庞大,领域本体构建工作复杂繁重。运用本体展现领域知识中所蕴涵的大量事实和复杂关系,需要对本体库进行维护、更新、检测和知识发现,本体知识推理就是一个十分重要的技术手段。实践表明,基于本体的知识推理极大地减少了本体构建工作量,减轻了对领域专家的依赖,有力地帮助我们发现了许多手工构建时由于疏忽而导致的逻辑错误,满足了用户对国共合作领域错综复杂的蕴涵知识的推理检索。
1.检测本体知识逻辑错误
描述逻辑(Description Logics,DL)是一种基于对象的知识表示的形式化工具,通过描述领域中概念、角色(关系)和实例的方法来描述领域知识。同时描述逻辑是一阶谓词逻辑的可判定子集,能够提供可判定的推理服务,并且具有语义特征。由于OWL是基于描述逻辑的描述语言,这就意味着OWL中的类构造算子和公理都有相应的描述逻辑元素表示,利用OWL构建的本体库能够同时具备良好的表现能力和强大的推理能力。OWL能够很好地表现特定领域的知识结构和概念层次,同时建立概念和关系的蕴涵公理,在此基础上,本体库可保证知识结构的逻辑一致性和有逻辑保证的可拓展性。
基于描述逻辑的推理主要包括一致性检测、包含检测和本体实例检测。这些逻辑检测功能对于本体库构建工作具有十分重要的意义。逻辑检测增强了开发人员发现本体库中逻辑错误的能力,减小了本体构建工作发生错误的可能性,减轻了管理和维护本体库的工作量,也为今后本体库拓展和本体库集成提供了有利条件。
2.发现本体领域蕴涵知识
与基于描述逻辑推理互为补充的是基于规则的推理。规则推理利用基于RETE算法的模式匹配方法通过对组成规则的模式的匹配来得到满足规则的元组,进而得到推理结果。这种推理主要用来发现在大量事实中蕴涵的知识,表现本体库知识中可推论的部分。例如,本体库实例中大量存在的具有传递性的部分—整体的关系以及家族关系等都可以通过推理来实现。项目中的人物家族关系推理,可以通过人物的夫妻、父母、儿女、出生日期4个关系属性和“性别”数据类型推理出更加复杂的38种家族关系。(www.xing528.com)
基于规则推理还可以用来支持用户的高级检索。例如,用户可能需要查找西安事变发生前后一个月内所发生的事件,来获取西安事变发生的背景知识。这种与时间相关的事件知识在本体库中是没有定义的,通过定义动态的查询规则对本体库已有的事件事实进行推理来得到检索结果。通过规则推理来发现蕴涵知识,使无论是开发人员还是本体库本身都可以避免陷入纷繁复杂的领域知识语义关系网络中,开发人员可以专注于对整个知识领域框架的把握和理解。这样本体构建在更加简单、有效率的同时能够表现出更加丰富的领域知识。
3.减少本体构建工作量
将两种推理方法结合应用到本体构建中,最显著的效果就是极大减少了本体构建的工作量,通过在现有本体库的基础上进行推理,得到了一个更大的逻辑(虚拟)本体库。有效地拓展了前台能够检索到的领域知识的广度和深度。目前我们在本体库中建立了167个本体类、108个关系属性和13 129个实例(其中事件本体实例761个,资源本体实例678个,组织本体实例951个,人物本体实例1 712个,地点本体实例1 361个,时间本体实例3 361个,角色类实例2 838个,其他类实例1 480个),平均关系复杂度为5(目前该领域研究的平均关系复杂度为2)。通过推理得到的推理库仅关系属性就增加到215个。试想,如果这些增加的部分都要在本体库中事先定义好,对于本体构建人员来说无疑是一场噩梦。
4.减轻对领域专家的依赖
同时,引入推理还减轻了本体构建工作对领域专家的依赖。领域本体构建需要领域专家的强有力支持。但是,在领域专家的工作中,很大一部分工作放在了历史史实的确认和个体间关系的确定,这是一项对于领域专家来说简单而烦琐的工作。通过分析和研究,我们发现将这些分类确认和关系建立所蕴涵的模式编写成规则,利用推理来完成这方面的工作,具有很好的效果。这也使得项目组减轻了对领域专家的依赖,加快了本体库构建工作进度。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。