本体描述语言又称为本体构建语言、表示语言等。本体构建必须通过计算机语言来描述表达本体,才能够为计算机所理解,这种语言就称为本体描述语言。在具体应用中,本体的表示方式主要有三类:完全非形式化语言、半形式化语言、完全形式化语言。完全非形式化语言是用自然语言表示,可以是受限的或结构化的,用来提高本体的清晰度,减少模糊性;半形式化语言是用人工定义的形式化语言表示,常用的方法是定义一些特定意义的标签,比如使用XML表示;完全形式化语言具有详细的概念项定义、语义关系的形式化定义以及完整的公理和证明。本体描述语言用来描述本体,应该具有:语法定义良好、语义定义良好、支持推理、表达能力充分、便于表达等特点。
实际应用中,完全非形式化语言、半形式化语言、完全形式化语言这几种表示方式各有所长。非形式化语言可以加强人与人之间的交流。形式化语言适用于自动化程度高的计算机处理,因此如果对本体的处理需要由机器自动完成,则形式化程度越高越好。本书希望通过计算机来构建和应用地铁施工安全风险本体,故选择形式化语言来表示本体。形式化语言有XML、RDF、OWL等。
为了实现本体的构建和应用,人们已经开发出多种类型的本体建模工具,用来进行本体的构建、存储、查询、推理等。本体建模工具是人类非形式化语言与形式化本体语言之间的一个重要媒介,可以将人类非形式化语言转化为计算机语言,为计算机所理解,使得本体的开发过程得以实现。本体建模工具大致可以分为两大类:基于某种特定的语言(Ontolingua[69]、OntoSaurus[70]、WebOnto[71]等)和 独 立 于 特 定 的 语 言(Protégé[72]、WebODE[73]、OntoEdit[74]、OilEd[75]等)。
(1)Ontolingua是世界第一个较为规范的本体建模工具,基于Ontolingua语言,由斯坦福大学知识系统实验室(KSL)于1995年开发,支持分布式合作方式用以发布、浏览、创建和编辑本体,但是Ontolingua需要通过互联网,用户需要登录相关网站按照要求进行注册之后才可以使用。
(2)OntoSaurus由南加利福尼亚大学于20世纪90年代初开发,包括一个本体服务器与Web浏览器,基于Loom语言描述本体,利用Web浏览器进行浏览,主要由Loom提供推理功能。
(3)WebOnto由美国Open University知识媒体研究所于1997年研究开发,用OCML描述本体,支持多人合作构建本体,用户之间可以讨论。WebOnto的使用与Ontolingua相同,注册后获得用户名和密码,才可以在线使用网络版WebOnto来构建本体。
(4)Protégé由斯坦福大学研究开发,是一个基于Java环境的开源应用软件,可以用XML、RDF、RDFS、OWL等语言描述本体和修改本体。Protégé可以通过嵌入一系列插件,如语言转换插件、知识获取插件、本体可视化插件等来实现功能扩展。
(5)WebODE由马德里科技大学在ODE的基础上开发,主要作为网络服务器,核心是本体访问服务。支持XML、RDF、RDFS、DAML+OIL等多种本体语言,提供本体评估和合并服务。WebODE还支持多种本体构建方法。
(6)OntoEdit由德国卡尔斯鲁厄大学研究开发,使用OntoBroker引擎进行推理,支持本体描述编辑多种语言,具有良好的可扩展性,利用图形工具支持本体开发和维护。OntoEdit提供可下载测试版本给用户试用,但仍然需要注册获得用户名和密码才可使用,而且现在使用语言局限于英语、德语和法语,一定程度上限制了其在中国的应用。
(7)OilEd开始是欧洲IST On-To-Knowledge项目组开发OIL本体的编辑器,采用FaCT引擎进行推理,支持HTML在内的多种格式,还可以实现图形可视化。
李景等[89]、陶皖等[76]、Duineveld等[71]和徐国虎等[78]从本体建模工具的可用性(获取方式、使用指南、访问工作、可视化视图、自带本体库)、软件结构(体系结构、可扩展性、本体存储、备份管理)、文件格式(导入格式、输出格式)、知识表达能力(表示形式、公理语言、构建方法)和推理机制(推理引擎、语法检测、一致性检验、自动分类、例外处理)等方面进行比较研究,发现Protégé具有较大的优势。涂菁比较了Ontolingua、WebOnto、Protégé、ODE、OntoSaurus几种本体建模工具,Protégé在语言学习难度、工具使用难度方面具有较大优势[79],如图2-2所示。
图2-2 本体建模工具比较
本书采用Protégé软件进行本体建模,Protégé的优势在于:(www.xing528.com)
(1)基于Java源代码开源免费,便于学习和交流;
(2)结构可扩展,附有约束检验、知识获取、本体可视化等插件实现功能扩展;
(3)支持RDF、RDFS、OWL等多种本体语言编辑和修改本体;
(4)自带有本体库实例和用户指南,便于用户学习;
(5)支持以文本文件和数据库方式存储本体。
Protégé软件具有上述优势,成为许多学者进行本体建模优先选择的工具。Protégé软件主要通过构建类(Class)、属性(Property)和实例(Individual)来构建本体。
类是指具有共同特征的事物的概念集合,比如可以分别将“动物”“肉食动物”“素食动物”“植物”“树”“草”定义为一个类,且“肉食动物”“素食动物”是“动物”的子类,“树”“草”是“植物”的子类。
Protégé中 将 属 性 分 为 对 象 型 属 性(Object property)和 数 据 型 属 性(Datatype property)。对象型属性表示的是两个类之间的关系,如图2-3所示,“吃”这个属性将“素食动物”和“植物”这两个类建立了联系,代表素食动物吃植物这一关系。数据型属性表示的是类和数据之间的关系,如图2-4所示,“动物”的年龄是数值,比如1、2、3等,“年龄”这个属性就是数据型属性。
图2-3 对象型属性示例
图2-4 数据型属性示例
实例,就是一个具体实际存在的事物、事实,比如,“长颈鹿”是“动物”这个类当中的一个实例。类是概念化的,而实例是具体化的。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。