下面具体介绍本体构建的原则、过程和常用的编辑器。
1. 本体构建原则
Gruber在1995年给出了构建本体的五条意见 (Adle等,2001),陆建江 (2007) 等给出了解释,现引用如下:
(1) 清晰性。本体应能有效地传达其中所定义的术语的含义。这便要求术语的定义尽可能客观。但实际上,定义一个概念常受社会背景与所处的环境影响。要避免定义受到这些因素的影响,就需要借助形式化方法。此外,给出的定义应该尽可能完善,所有的定义应该以自然语言的方式文档化,方便别人能正确理解这些术语的含义。
(2) 一致性。本体必须是一致的,即由本体得出的推论与原有的定义是相容的,不能产生矛盾和冲突。本体中定义的公理应该是逻辑一致的,这是最基本的要求。概念也同样要满足一致性的要求。
(3) 可扩展性。本体在设计时不仅要使用领域内公认的词汇,同时还要考虑可能的应用任务范围,使得本体的表达能被单调地扩展。也就是说,本体应该能够保证添加新的通用或专用术语,而不需要修改原有的定义,即能支持在已有的概念基础上定义新术语。
(4) 编码偏好程度最小。概念应该在知识层次上说明,而不应依赖于特定的符号层次的编码。编码偏好应该是最小化的,因为不同的知识系统可能采用不同的标识系统或表示风格。
(5) 最小本体承诺。对建模对象给出尽可能少的约束。所谓承诺,是指为了在本体中以一致和相容的方式使用共享词汇所达成的共识。一般地,本体承诺只要能够满足特定的知识共享需求即可,这可以通过定义约束最弱的公理以及只定义交流所需的基本词汇来保证。
实际上,这五条设计准则在使用过程中往往需要进行权衡,难以全面满足。例如,清晰度准则要求本体中的定义尽可能限制术语有多重解释,而最小本体承诺却意味着能采纳多种可能的模型。
2. 本体构建方法
一般的本体构建都是针对特定领域的,许多人都提出了本体的构建方法,有Mike Usehold和King的“骨架”法 (W3C,2001)、Gruninger和Fox的“评价”法 (Boag等, 2006)、Bemeras et alia方法 (Kazai,2002)。本体构建的具体步骤如下:
第一步: 确定本体的目标。
这与软件设计相似,相当于需求分析的目标分析,首先要对本体的需求目的有一个明确的认识,即为什么要使用本体? 它将被用来干什么和它将被怎样使用? 回答这些问题的方法主要有:
(1) 确定和识别本体用户的范围 (如管理者、技术人员、程序员)。
(2) 确定要完成的事情,做到什么程度。
(3) 建立一个关于本体用途的用户需求文档,分析每种需求,越详细越好。
(4) 考虑重用现有本体。相关领域有一些已经做好或公认的本体词汇,如果应用的需求能够使用这些词为实现最好不过,但是现实是复杂的,我们可能要为特殊情况作特殊的考虑。这样可以给予一般标准的本体词汇加上自己设计的为特殊情况的词汇构成此应用的词汇。(www.xing528.com)
第二步: 确定本体的主题范围。
根据本体的应用目的和设定的形式化程度,确定本体的知识主题范围。列出所关心的术语,这些术语大致表明建模过程所感兴趣的事物、事物所具有的属性和它们之间的关系等。
第三步: 建立本体。
在拥有了本体所必须包含的主题知识集合后,下一步就是建立本体来表示知识,这也是知识的概念化和形式化的过程,其任务包括三个部分。
(1) 设计领域知识的整体概念结构,包括识别该领域重要的概念项、概念属性和概念关系; 提取或设计抽象概念作为组织特性; 识别具有实例的概念; 产生概念定义,决定对已定义的项进行组织,确定本体的结构; 根据实际需要设计其他一些指导方针等。
(2) 利用类、关系、函数、公理和实例等本体要素组织和表示领域概念知识,其详细程度以满足本体的应用目的为宜。
(3) 选择合适的本体工具和本体语言,建立具体的本体。
第四步: 检查和评估本体。
通过领域专家对本体进行最终验证,包括检查各个本体论元素间的句法上、逻辑上及语义上的一致性,依据评估参考 (如需求说明、应用场景和能力问题等) 对本体、本体相关的软件环境和文档做技术性评判。
第五步: 提交本体和反馈。
将本体发布到相关的应用环境并进行配置,应用反馈信息将用于对本体的修正和完善。
3. 本体编辑工具
本体的编辑工具目前有Oil Ed、Onto Edit和Protege等。
Oil Ed是Manchester大学开发的本体编辑工具,是免费软件,采用Java语言开发,有着良好的图形化界面,延续了Windows 风格,易于使用。Oil Ed较好地结合了框架表示和描述逻辑表示二者的优点,用以辅助建立以OIL或DAML+OIL本体语言描述的本体。它的不足是不支持版本标识和不支持多本体编辑器。
Onto Edit是德国Karlsruhe大学开发的本体编辑器。后来成为Ontoprise公司的一个商业软件,并在它的基础之上开发了新的本体编辑环境Onto Studio。Onto Edit具有图形化的界面,它提供了本体的可视化,支持多种语言,查询过程中支持推理,可以进行协同本体开发,并且支持插件。
最著名的本体编辑器当属Stanford大学开发的Protege,它的最新版本是Protege 3.4beta (http: //protege.stanford.edu/download/)。Protege是一个免费,开放源代码的本体编辑平台,包含了几十个样例本体和几十个插件。它是用Java语言编写的,能在Windows、Solaris和Linux等平台上使用。它主要采用图形化界面,主界面包含多个标签,分别支持Classes、Slots、Forms、Instances和Queries等编辑操作。Protege支持OWL、RDF (S)、XML和DAML+OIL等本体语言,提供了对本体的读入和编辑后的输出,其中对OWL文件的操作借助了惠普实验室开发的Jena工具包。Protege中的推理嵌入了Racer和CLIPS等推理引擎。Protege支持功能上的可扩展性,很多本体应用可直接在它的基础上进行特定应用的二次开发。插件是Protege中最重要的特色,用户可以根据所需要的功能选择相应的插件,被选中的插件会以新标签的形式出现在主界面中。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。