首页 理论教育 CADAL数字图书馆知识组织工具及应用研究

CADAL数字图书馆知识组织工具及应用研究

时间:2023-10-27 理论教育 版权反馈
【摘要】:为了满足这种需求,学者们对知识组织工具进行了细致的研究。网络环境下新出现的知识组织工具主要有Taxonomy,Semantic Web,Ontology和Topic Maps。这一特征明显将taxonomy与传统的知识组织工具区分了开来。

CADAL数字图书馆知识组织工具及应用研究

知识组织工具也称为知识组织系统或知识组织体系,是用于进行知识组织的各类规范和方法的统称,是获取、利用知识的重要手段。[7]知识组织工具是在文献资源数量激增,用户对资源的需求愈来愈迫切的情况下出现的。为了满足这种需求,学者们对知识组织工具进行了细致的研究。传统的知识组织工具主要可以分为两大类:一类简称为分类法,如图书分类表;另一类简称为主题法,其代表主要有主题词表和叙词表。分类法主要着重于建立知识的结构,而主题法主要着重于词汇的控制。随着网络信息资源呈几何级数的增长,分类法和主题法愈来愈难以满足人们将大量杂乱无序的信息和知识进行序化的需求。于是,新型的知识组织工具就出现了。网络环境下新出现的知识组织工具主要有Taxonomy,Semantic Web,Ontology和Topic Maps。这些新型的知识组织工具沿用了传统的词汇控制和知识分类的原理与方法,同时结合当前网络环境发展的需要和特征,并对某些方法进行了增强或结合,从而显示出了新型知识组织工具的新用途和新特征。

2.2.4.1 Taxonomy

Taxonomy一词来源于生物科学领域,主要是指动植物有机体的分类体系。在知识组织领域,taxonomy是近几年才出现和发展起来的,很大一部分原因是来自于商业界对网络信息分类组织的需求。从广义上来看[8],taxonomy泛指一切具有分类功能或登记结构的知识组织工具,如万维网指南、图书分类法、企业实用信息分类系统以及支持自动标引的分类表等,都可以归类到taxonomy的范畴。从狭义上来看[9],在知识管理的框架下,taxonomy则特指企业信息分类系统(corporate taxonomy)。虽然目前对taxonomy的概念还没能够达成共识,但它与传统的知识组织相比,有其独有的特征。首先,在使用范围方面,taxonomy主要用于某一特定机构(主要指企业)。这一特征明显将taxonomy与传统的知识组织工具区分了开来。传统知识组织工具如分类法、叙词表等主要用于图书馆与情报中心,在组织企业资源方面显得力不从心。其次,taxonomy类表简单、灵活,易于理解和使用。它由等级结构和主题词两个部分组成,其各种应用功能均由这两个部分组合实现,taxonomy的这两个构成元素与分类法和叙词表的组成元素有着相似性,但它们在属性和功能上是有区别的。[10]从属性上来看,taxonomy的分类结构更简单、灵活、实用,并不局限于学科分类,更着重于采用普通用户可以理解的分类结构;它的类表类型不局限于等级列举式,更为广泛地采用分面分类和多重列类;类目划分也更为灵活。而从功能上看,taxonomy可应用于各种环境和支持各种用途,如源信息自动分类、检索提问处理、检索结果优化等。不过相对来说,taxonomy更常用于企业等某一特定机构的知识分类和网站浏览、导航,也是企业知识管理、知识库建设的重要组成部分。最后,Taxonomy具有两个基本功能,分别是浏览和辅助检索,而浏览则是其最主要的功能。[11]

2.2.4.2 Semantic Web

拥有万维网之父之称的伯纳斯·李(Berners Lee)于2001年对下一代互联网的前景进行了描绘,并称下一代互联网为“语义网”。伯纳斯认为,语义网是对目前网络的一个延伸,在其中信息具有明确的语义,所以能够实现计算机和人更好地协作。和万维网不同的是,语义网为智能网络的一种,其目标是扩展现行的互联网,从而使得全部内容更容易使用,整个互联网可以自动处理,最终构建一个计算机可理解的全球平台。换言之,语义网是数据网,是机器可理解的信息,更是一个世界性的数据库,在该数据库中,所有能够确定的内容,诸如人、事件、时间、物体等,都能够以实体的形式分布在语义网当中,并且每一个实体都具有一个统一资源标志。语义网是下一阶段信息革命的代表,可以将它看成一个巨型大脑,各个数据库作为其组成部分,协调能力极其强大,智能化程度也非常高,能够解决各种类型的难题。因此,也有学者称语义网为“数据库协调好、智能化的巨型大脑”。另外,元数据是语义网的核心,语义网通过基于现有Web增加标准的、共用的,且机器能够理解的元数据,使原来很多在Web环境下无法实现或难以实现的应用成为可能或变得更有成效,如信息过滤、信息获取、Web自动服务等。

目前,语义网有两种形式:一种形式为可扩展的标识语言(extensible markup language,XML)+实用分类系统(ontology)+资源描述框架(resource description framework,RDF)。架构语义网需要提供一种语言,该语言可以同时对数据和根据数据进行推理的规则进行表达,还准许任一现存知识表现系统中的规则能反映到网络上。RDF与XML满足这个要求,它们与实用分类系统一起构成了语义网的三个组成要件。另一种形式为通用资源标识符(uniform resource ldentifier,URI),它是标识概念或资源的一种文本字串,也叫作URL,如在互联网上常看到的以“Ftp”或“Http:”开头的字符串。它具有多种形式,能够标志的东西也多。其最大特点为准许任何人通过在网络上定义一个URI,以此定义很多新的概念或名称。它能够标识定位全部的互联网资源,是构成语义网的一个基石。(www.xing528.com)

2.2.4.3 Ontology

本体是知识组织的工具之一,知识组织的本体论是近年来学者们关注的热点问题之一。它早期为哲学领域的一个概念,从20世纪90年代开始,转变为计算机人工智能领域研究的本体,并成为图书情报界的一个热点研究领域。有学者认为本体是通过描述、捕获领域知识,确定领域内共同认可的概念和概念间的关系,以用于领域内的不同主体之间交流与知识共享的形式化规范说明。李景[12]对本体技术标准化问题进行了研究,认为本体技术的标准化包括:叙词表、分类法、本体表示语言、本体设计基本技术路线、本体系统的开发、顶级本体的逻辑结构、领域本体的构建、本体在语义网中的应用等多方面。李弘伟和王惠临[13]从主要元素和推理机制出发对8种常用本体表示语言进行了分析研究,探讨其语法、语义转换技术、转换模型和转换工具。当前在图书情报这一领域当中,大部分学者认为“本体是给出构成相关领域词汇的基本关系与术语,并利用这部分基本关系与术语的构成规定这部分词汇外延的规则”、“本体是对概念化的精确描述”或者“本体是对某个概念集的一个规范说明”。

2.2.4.4 Topic Maps

主题地图(topic maps)是一种用来描述知识以及知识与信息资源联系的方法。它是一种知识网络,该知识网络中不同的网络节点代表不同主题的知识,而节点间的连线则代表着主题之间的联系,任意两个主题之间的距离能够根据节点间的连线数量来计算,而这部分连线则代表着从某一主题到达另一主题的路径。通过这种主题地图,人们能够把抽象的知识内容连接成具有概念坐标的一个知识地图,在海量的信息之中,可以借助寻址与链接技术形成知识结构。用户能够根据自己对某领域的认识和了解程度,从自己有兴趣或者熟悉的主题方向出发,获得自己所需要的相关知识。主题地图可以描述并管理无限复杂的信息世界,但它的基本构成却很简单,由主题(topic,T)、事件(occurrence,O)以及关系(association,A)三要素共同构成。主题地图的基础理论研究主要包括主题地图标准体系的建立与研究、主题地图与其他知识表现技术的比较和互操作研究、主题地图结构及特征要素的研究等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈