语义Web涉及两个方面:一是公共格式,用来集成和合并从异构源中导出的数据,二是语言,用来记录数据是如何与真实世界的对象相关联。[77]
语义Web提供了一个特别强大的数据集成形式。它使用URIs,通过将原始数据(在数据库、XML文档等中)与商业使用的真实事物(如客户、产品等)的模型相关联来做到这一点。任何一个不需要其他帮助而执行任务的系统将不能达到允许数据从一种应用转到非期望方式的其他应用的效果。任何一个完成相同事情但不使用共同标准的系统将是不兼容的,将不会成为语义Web的一部分。[78]
语义Web促进了WWW的发展,并形成知识表示和计算的分布式系统。语义Web的目的不仅支持基于链接或搜索引擎的Web信息的存取,而且支持这些信息的使用;不是通过关键词匹配来检索文档,而是有可能通过信息的合成来回答问题;不是检索一个到某地的旅行计划,而是有可能自动构建一个满足某些目的并利用动态产生的机会的旅游计划。这带来了极大的挑战。语义Web提出了多个创新观点来达到其目的[79]:
(1)标准格式。语义Web为表示格式的统一元层次描述语言设计了标准。除了作为交换的基础外,这些语言支持多个层次的知识表示。例如,文本可以被注释成形式化表示。自然语言“北京是中国的首都”,可通过注释对其中隐含的知识进行形式化表示,即北京可注释为“城市”,中国注释为“国家”,则这个句子的结构可表示为:capital-of(北京,中国)。对文本文档进行注释促进了文本与形式化知识表示的结合。
(2)形式化的词汇和知识。语义Web倡导本体形式的共享词汇和共享知识的形成:如果有关大学课程的知识得到表示和共享,定义和使用公共词汇和公共基本知识是有益的。语义Web以本体的形式收集这些,并利用它们对新的领域和活动建模。这意味着大量的知识将得到结构化、形式化的表示以促进自动存取和使用。
(3)共享的服务。除了静态结构外,还有动态的服务。服务在请求者和应用者之间协调,并有可能在不同系统上自动唤起应用。
语义Web为Web内容扩展了机器可处理的语义信息。在语义Web中,文本、Web服务等资源被赋予了各种明确的语义信息,机器可以分辨和识别这些语义信息,并对它们进行自动解释、交换和处理。语义Web对现有的Web进行了语义扩展,从而使机器能够进行一定的理解和处理。从功能上看,语义Web将是一个能够“理解”人类信息的智能网络。在不久的将来,当机器能够更好地处理和“明白”那些它们现在只能仅仅展现的数据的时候,必将涌现出更多的功能,大量的语义Web应用将被利用到多种不同的任务之中,并促进Web应用向模块化方向发展。例如,某人想报名参加一个国际研讨会,计算机可自动地为其制定最佳日程和路线以及预定旅馆等。[80]
语义Web是推动未来Web发展的核心动力,它包含了相关的基础构件。互联网的创始人蒂姆·伯纳斯·李(Tim Berners-Lee)提出了语义Web的体系结构[81],如图7-2所示。
图7-2 语义Web的体系结构
在该体系结构中,第一层是Unicode(统一编码)和URI(统一资源标识符),它是整个语义Web的基础。Unicode提供资源的编码,URI负责标识资源,利用全球命名法则提供了推动Web利益的全球网络效果。URIs具有全球性,在不同的环境下可以得到一致的解释。将一个URI与某个资源相关联意味着任何人都能够链接到它,参考到它,或检索它的表示。在语义Web的目标下,需要对关系进行推理。URIs巩固了语义Web的基础,允许机器直接处理数据。语义Web从关注文档转到关注数据。(www.xing528.com)
第二层是XML+命名空间+XML Schema,提供了表示数据内容和结构的语法;第三层是RDF+RDF Schema,提供了描述Web资源的数据模型,可以表示论断、定义模式;第四层是本体词汇表,是在RDF Schema基础上定义的概念和关系的抽象描述,用于描述领域知识;第五层是逻辑,在下面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系。
可扩展标记语言XML提供了一种结构化文档的表层语法(surface syntax),但没有对这些文档的含义施加任何语义约束。XML Schema是一个约束XML文档结构和为XML扩充数据类型的语言。
XML为语义Web的发展带来了希望。蒂姆·伯纳斯·李(Tim Berners-Lee)认为语义Web的目标是开发出表达性(expressive)语言,从而以机器明白的形式描述信息。他将语义Web的功能架构总结为如下三层[82]:
(1)元数据层(metadata layer)。该层的数据模型仅仅包含资源(resource)和属性(properties)。当前,RDF被认为是元数据层最流行的数据模型。
(2)模式层(schema layer)。在该层引入Web本体语言,以对概念和属性进行层次描述。RDF Schema被认为是模式层语言的最佳候选者。
(3)逻辑层(logical layer)。在该层引入更有力的Web本体语言,这些语言提供更丰富的能够映射到有影响的表达性描述逻辑的建模初始集。OIL(Ontology Inference Layer,2000)和DAML-OIL(Darpa Agent Markup Languare-Ontology Inference Layer,2001)曾经是两个流行的逻辑层语言,目前广为接受的是OWL。
资源描述框架RDF[83]是一个关于对象(或资源)和它们之间关系的数据模型,且为该数据模型提供了简单的语义。RDF的基本结构是对象—属性—值三元组,即句子中的主语、谓语和宾语,这些三元组可以用XML语法来表示。RDF Schema[84]是一个描述RDF资源的属性(property)和类(class)的词汇表,提供了关于这些属性和类的层次结构的语义,它可以看成是轻量级的Web本体语言。
本体是支持知识共享和重用的形式化结构,它们可以用来清晰地表示结构化和半结构化信息的语义,从而支持信息的自动获取、维护和存取。本体提供了解决Web资源异构表达的方法,本体中隐含的领域模型可看成是为信息提供一个统一的共同表达的语义结构[85]。OWL是Web本体语言,OWL提供了一种自然方式来描述类与子类之间的关系,以及在类与类之间(或子类与子类之间)关系上的限制[86]。相对于RDF Schema来说,OWL添加了更多的用于描述属性和类的词汇,例如类之间的不相交性、基数、等价性、属性的更丰富类型、属性特征以及枚举类。OWL提供三个表达能力递增的子语言:OWL Lite、OWL DL和OWL Full,分别用于特定的实现者和用户团体。
从某个方面来说,XML Schema、RDF Schema和OWL可看成是表示功能递增的语言,它们逐渐具有更多的语义表示能力,并分别和不断满足了不同层次和不同时期知识处理的需求。
构建在Web架构之上是设计和开发语义Web标准的一个重要的技术限制。语义Web是Web的发展而不是重新开始,构建语义Web的重点在于将这项工作置于当前Web基础架构之上,以便同时创造文档Web和数据Web。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。