本体语言中,现在为大多数开发者使用的是由W3C推荐的网络本体语言(Web Ontology Language,OWL)。OWL是基于描述逻辑的网络本体描述语言的标准。它是在DAML+OIL的基础之上发展形成的较为成熟的本体语言。OWL是一种能够理解信息语义内容的语言,比RDF、RDFS和DAML+OIL等语言更能提高网络内容的机器可读性。一方面,OWL要保持对DAML+OIL/RDFS的兼容性,提供更加强大丰富的语义表达能力。另一方面,OWL还要保证描述逻辑(description logic,DL)的可判定推理。OWL有3个表达能力递增的子语言:OWL Lite、OWL DL和OWL Full。OWL Lite表达能力最弱,仅可以提供类分层的能力和简单的约束功能。它支持基数约束,但只容许基数值为0或1。OWL DL在保持计算完整性和可判定性的前提下,提供了尽可能大的表达能力。OWL DL包含了OWL的全部语言构造成分,但它们的使用受到一些限制(如一个类可以是许多类的子类,但不能是另一个类的实例)。OWL DL还可提供描述逻辑的推理功能。OWL Full则包含OWL的全部语言构造成分,并取消了OWL DL中为了保证可计算性而采取的某些限制,因此,目前不存在完整的推理算法支持OWL Full的全部特性。[6]
本体构建工具主要有DAMLImp(API)、KAON(包括OIModeller)、OILED、OntoEdit、Ontolingua with Chimaera、Ontosaurus、OpenCyc Knowledge Server(简称OpenCyc或Cyc)、Protégé‐2000、RDFAuthor和WebOnto等。[7]其中在国内应用广泛的有Protégé、KAON、OILED等。
KAON的全称为The Karlsruhe Ontology and Semantic Web Infrastructure,是由德国卡尔斯鲁厄大学开发的本体构建工具。KAON运行环境为基于Java环境(需安装JDK),导入文件格式为RDF(s),导入文件格式支持RDF(s)、OL‐Model、OWL等。KAON最大的特色是其支持语言很多,包括英语、汉语、法语、德语、阿拉伯语、西班牙语、葡萄牙语等语种。KAON的基本功能包括本体的构建、检索和浏览。KAON的可视化本体构建不仅更加直观,而且能够在实际建立本体的过程中起到载体的作用,关于概念与概念、概念与属性、属性与实例、实例与实例之间的关系的操作都在可视化条件下进行。[8]
OILED是英国曼彻斯特大学和阿姆斯特丹公立大学开发的基于OIL的本体编辑工具。OILED允许用户使用DAML+OIL构建本体。它是开源的,用户可以很方便地下载使用。OILED的新颖之处在于其对框架编辑器范例进行了扩展,使之能处理表达能力强的语言、使用优化的描述逻辑推理引擎、支持可跟踪的推理服务。但是,OILED不支持协同工作。此外,OILED有内置的推理引擎支持其推理工作,但它不能对实例和具体的数据类型进行推理。[9](www.xing528.com)
目前,国内最流行的本体构建工具当属Protégé。Protégé的元数据首先是由马克・姆森(Mark Musen)于1987年为了一些医学项目的知识系统化而创建的,后由斯坦福大学医学院的医学情报学研究组(Stanford Medical Informatics,SMI)(一个跨学科的研究小组)开发研制。Protégé‐2000的开发环境是Java Standalone Application和Java Plug‐in Architecture,它在元类、类和属性的设置上具有OKBC的兼容性,其公理的格式符合KIF和PAL(The ProtégéAxiom Language)语言(PAL是一种表达逻辑约束条件的语言,并且是知识库框架下的查询语言),知识获取的形式是自动生成并抓取实例,本体的合并工具为插件Protégé Prompt,输入和输出格式支持RDF(S)、OIL、XML和OWL。Protégé‐2000拥有大型的用户团体。在本体创建的过程中,为了引入或复用其他本体,Protégé‐2000 v117~211系统会自动生成知识获取工具。Protégé‐2000没有协作开发或直接输出表示语言文件的功能。Protégé软件的标签形式是广大软件使用者习惯的操作形式,的确非常易于使用,但它本身不具备本体文库。此外,Protégé‐2000还提供本体的图形化表达方法。[10]
Protégé之所以成为较成功的本体编辑工具,其原因之一在于Protégé有一套完善的管理机制:Protégéwiki、Protégé协会、Protégé国际会议、Protégé用户培训等。有学者对Protégéwiki上所列的可以链接的99个应用项目的学科范围进行了统计,Protégé在自然科学领域(生物和医学、信息技术、数学、工业、天文、航海、机械、石油开采、农业、人体测量学等)的应用占59%、社会科学方面(信息管理、经济、法律、教育、国土规划、社会、管理、旅游等)占26%、人文学科领域(语言学、历史、地理、艺术、哲学等)占16%。其中,占比最高的学科分别是“生物和医学”(24%)、“信息技术”(22%)、“信息管理”(10%)和“语言学”(7%)。生物和医学所占比例最大,这与Protégé开发机构为斯坦福大学药学院药学信息学系有关,在逻辑结构的创建方面比较适合这一领域;而信息技术领域占22%,说明Protégé和本体这种信息组织的方式得到了信息技术开发者的青睐;信息管理方法和语言学则是本体开发和应用中关键因素,Protégé在这两个领域中的应用也得到研发者的重视。其他学科还包括哲学、社会、安全、管理、天文、航海、旅游、机械、石油开采、工业、制造、农业、人体测量学,等等,说明Protégé的学科使用面已相当广泛。[11]
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。