首页 理论教育 国家创新发展中知识元链接映射与基于本体的主题关联服务

国家创新发展中知识元链接映射与基于本体的主题关联服务

时间:2023-07-29 理论教育 版权反馈
【摘要】:基于本体的主题关联服务知识链接的实现模式之一是根据本体的思想建立表示知识关联的概念网。图9-15基于主题图的知识链接值得指出的是,在知识链接服务中,知识映射和基于本体的主题关联组织,不仅展示了各种复杂关系,而且形成了主题链接、知识元链接、聚类链接、知识推理链接的服务基础。

国家创新发展中知识元链接映射与基于本体的主题关联服务

知识链接服务需要直接面对用户环境,综合运用知识构建技术,在分析知识要素的体系结构和展示方式基础上,实现知识层面的聚类分析、有序组织、导航检索、统计评价。这就需要在服务中深化知识揭示的内容,形成以用户为中心的知识关联组织与表达。其中知识元链接中的关系映射、基于本体的链接和基于主题图的链接是当前需要面对的问题。

(1)知识元链接中的实体映射

在知识链接中,实体映射模式需要采用相关的映射规则,建立映射模型,以一个实体对象作为映射源(Source),另一个实体对象作为映射目标(Target)。映射依据实体间的主要匹配关系进行实体含义完全相同的匹配、目标实体的上位匹配、目标实体的下位匹配、部分相同实体的近义匹配。由于相近程度量化的难度较大,在具体操作中可以定义近义匹配。

实体映射模式中,可以分为实体本身映射和实体关系映射。实体映射可以分为一对一的映射、一对多的映射和多对多的映射。实体一对一关系映射即二者语义完全一致;一对多关系,如汉语中的一个词语对应英语中的多个词语;多对一关系,如汉语中的多个词语与英语中的一个词语有映射关系;无对应关系,即汉语中没有与之对应的词语。实体关系反映的是实体之间的父/子联系,具有分类的含义,表现了实体的层次结构。实体关系的映射可以将整个层次结构映射为一张表,也可以只将位于层次结构中最底层的子类映射为独立的关系,而将父类中的属性复制到子类中,还可以将父类与子类各自映射成独立的表,父类所对应的表是主表,子类所对应的表是从表。子表不包含来自父类的属性。

实体不仅具有上下位、多层次关系,而且具有网状关系,因此在建立实体间映射关系时,只在距离最短、关系最近的实体间建立关系。如果需要,只要将词表的原词间关系导入映射信息即可确定新的映射关系。例如在图9-14的映射模式中,如果概念a与概念A精确匹配,则概念b、c、d、e将自动成为概念A的下位词。实体映射模式将利用计算机进行匹配推理运算,对实体语义距离进行考察,获得最短语义距离。自动显示三大类特征的词汇:一是词汇相同、关系相同;二是词汇相同、关系不同;三是词汇不同、关系相同。系统通过提供相同关系与不同程度的计算功能,按照相同程度从高到低地确定具体的映射匹配关系。

图9-14 映射匹配模型图

目前实体映射模式主要应用于分类法映射、叙词表映射以及主题概念的语义关系映射。不同分类法之间的映射有两种模式:第一种,建立主要类目的对照,抽取所有映射分类法的主要大类,在这些大类之间建立相互的对照关系;第二种,将多个分类体系向一个通用体系转换,即选择一种通用分类法作为统一分类法或交换体系,将不同分类体系及其所含内容转换到统一分类体系的相应类目下。

(2)基于本体的主题关联服务

知识链接的实现模式之一是根据本体的思想建立表示知识关联的概念网(Concept Network,CN)。在CN模型中,节点代表概念,网的关联边代表概念之间的关联,概念之间的关联程度用关联度来表示,关联度越大,概念之间的联系越紧密。面向本体的概念网模型,其形式化描述为:CN={O,C,A/B/P,R,S},其中,O代表本体,C代表概念集,A/B/P代表属性集或方法集或性质集,R代表关系集,S代表规则集。建立领域本体知识库,可以用CN模型对知识进行直观表示,有助于更好地理解和完成知识推理,从而满足用户进行检索和实现知识导航的需要[18]

由于基于RDF/OWL的本体框架不支持知识的动态性、相对性和知识的细粒度,所以可以寻求本体基本元素和本体库之间的一个平衡点,即利用本体分子来完成关系表达。本体分子能完成四个层次的知识管理:元数据层、知识表示层、推理层和动态知识层。

元数据是描述数据的数据,处于模型的底层。元数据提供数字资源的描述基础,但元数据并不能完全解决信息系统的语义问题。由于要对本体分子进行基于语义的粒度切割,因此,本体分子的介入,正好能弥补这一缺陷。知识表示层可以通过本体中的类(Class)描述某一类事物,通过其中的实例(Instance)描述某一个具体事物,最后以三元组(Triple)的形式对知识与知识之间的关联进行阐述和表达。推理层在知识表示基础之上寻求一种基于本体的隐性知识智能推理机制,提供知识挖掘功能。基于本体的领域知识推理主要分为基于逻辑的领域知识检错推理和基于关系的领域知识发现推理。对本体描述的领域知识进行推理,可以检测知识逻辑体系错误,减少领域本体构建的工作量,减轻对领域专家的依赖,发现领域蕴含的隐性知识。

知识因子是组成知识单元的最细微的成分,知识关联是若干个知识因子间建立的联系。知识关联在新知识的产生中起重要作用,是知识有序化的必要条件。应用知识因子和知识关联的网状结构表示的知识单元,是知识链接服务拓展的基本内容。基于主题图的链接模型如图9-15所示。

图9-15中的知识因子表示从业务过程中提炼出的知识对象。知识关联即各节点之间的连线,说明了知识因子之间的联系。知识链接提供了知识的详细信息或知识本身的位置。将知识因子、知识关联、知识链接结合起来,构成了准确表达知识及其相关属性的主题关联图。

图9-15 基于主题图的知识链接

值得指出的是,在知识链接服务中,知识映射和基于本体的主题关联组织,不仅展示了各种复杂关系,而且形成了主题链接、知识元链接、聚类链接、知识推理链接的服务基础。(www.xing528.com)

(3)基于平台的知识链接门户服务

基于平台的知识链接门户服务围绕论文来源和引文关系分析展开,图9-16显示了中国科技信息研究所的平台服务。

知识链接平台所提供的知识服务是架构在知识资源组织层与协同应用层之上的,系统的知识服务只有以知识链接关系分析为基础才可能开展基本服务和延伸服务。从总体上看,服务包括以下几个方面:

图9-16 基于平台的知识链接关系

①关联检索。平台通过期刊论文引文间的关联关系,揭示内涵知识之间的逻辑关系,检索结果不是简单排列与堆积,而是在引文索引之上进行的有机联系[19]。在关联检索实现中,整个系统依据论文引文间引证关系,按照期刊、标题、作者、机构、关键词、来源、学科分类等入口,从论文、引文和期刊载体等方面进行检索。可以展示所检文献参考文献数、被引文献数、同引文献数、同被引文献数,从而显示相关的文献列表。例如:点击被引文献数链,可以了解该文献被哪些文献所引用;点击参考文献数链,显示当前来源记录所引用的参考文献列表;点击同引文献数链,可以查看与当前检索记录共引同一篇或几篇参考文献的一组文献,即同引文献;只要任意点击文献记录注明的该篇论文文献数链,便可生成一组新的记录。因此,通过层层激活,可以挖掘研究文献之间的相关性,及时了解某一研究领域的发展和动态。

通过以上4种文献引文间的关联性,可以实现文献内容关联的深层揭示。通过HTML或PDF还可查看记录完整的文摘信息或获取原文。

②专项检索。整个系统除论文、引文检索外,还提供了期刊、作者、来源机构等专项检索入口,从而实现专项查询功能,如图9-17所示。

图9-17 知识链接平台的专项检索功能

通过作者项检索,可以显示作者的所有单位,也可以按时间序列显示作者发表的文献记录,其记录包含了参考文献数、被引文献数和同引文献数、同被引文献数,因此还可以进行链接激活查询。同时,可以按刊物、学科进行筛选,可以进行构成分析和对比分析,可以统计作者发表文献总数以及总被引数。

③指标查询。整个平台系统从期刊名称入手,按照期刊学科分类,分年度提供期刊文献计量指标,可以查询来源指标和引用指标,可以按年度分指标进行排列。其中,指标包括载文量、总被引频次、影响因子、即年指标、被引半衰期、平均引文数、项目论文比、自引率、扩散因子等。相关指标值通过链接可以激活,“总被引频次”会显示期刊被哪些文献所引用,可以为科研绩效评价提供科学的量化依据。

同时,平台还按学科专业提供高被引作者、高被引图书、高被引机构(如大学、研究院所等)以及高被引出版社名录,提供项目资助的发表文献及其被引次数的检索和期刊高被引排行。

④原文链接。随着学术期刊论文组织的数字化,即时提供全文已成为现实。基于中文引文的知识链接平台的全文链接是开放的、双向的。可以由引证枢纽将各种全文文献联系起来,实现不同出版社、数据库或不同平台上内容的关联链接。可以利用OpenURL参考链接系统,解决与文献馆藏目录系统的无缝链接,快捷而深入地提供一站式服务,最终实现以出版商及其全文数据库为基础的开放整合服务。

为了实现原文链接服务,在知识链接平台体系框架下,通过知识资源建设、标准规范制定、数据加工规范和关联检索,保证了知识链接原文获取的跨系统组织与传递。

知识链接平台通过知识链接技术使零散的文献知识转化为网络知识,其本质上就是一种以用户为中心的针对性服务。首先,知识链接门户系统重视用户参与服务,平台根据不同的用户对象设计了不同的入口。同时针对用户身份或主题内容进行分类整合,最终精准锁定服务对象。其次,知识链接门户平台提供多种应用接入方式,同时按业务应用系统和知识门户结构化数据、文档类的非结构化类型使知识链接显性化。

知识链接平台可以为用户提供多种知识采集途径,使用户可以通过简单的操作完成基于知识门户的知识内容采集与更新。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈