首页 理论教育 CADAL数字图书馆浏览与检索模块研究成果

CADAL数字图书馆浏览与检索模块研究成果

时间:2023-10-27 理论教育 版权反馈
【摘要】:在搜索方式下,提供搜索提交接口,直接给出搜索到的所有相关资源,并给出所属主题以及有关该术语的基本知识,以及与该检索点关联的Topic的导航,包括它们的关联类型。在浏览方式下,根据导航领域给出引导用户进入的初始点,当前资源,以及下级Topic,采用分层导航模式,给出的信息与上述相同。

CADAL数字图书馆浏览与检索模块研究成果

6.2.1.1 知识导航

知识导航是提供信息获取以及基于知识的信息引导和浏览服务,伴随浏览过程而提供的检索服务,是针对知识导航所构建的主题地图的一种辅助搜索服务,而在层级结构较少的导航系统中,通常不提供辅助检索服务。知识导航与网络信息技术所提供的数据组织方式息息相关,信息技术的发展在很大程度上决定了知识导航能够采用的方式。可通过对文献资源的知识分类、组织等系列加工后,利用门户网站,提供馆藏数字化资源及互联网相关资源的导航功能。目前,网络知识导航和检索技术主要有3种:基于关键字的检索技术、基于分类目录导航与检索技术和基于概念检索导航技术。

(1)在搜索方式下,提供搜索提交接口,直接给出搜索到的所有相关资源(occurrence),并给出所属主题(Topic)以及有关该术语的基本知识(通过关系表示得出的知识描述),以及与该检索点关联的Topic的导航,包括它们的关联类型。

(2)在浏览方式下,根据导航领域给出引导用户进入的初始点,当前资源(occurrence),以及下级Topic,采用分层导航模式,给出的信息与上述相同。[11]

浏览方式下的导航主要可分为以下几类:

1)知识源导航。根据知识的来源类型进行导航,如知识在期刊、图书、报纸、图谱、视频、互联网资源不同来源中进行呈现。

2)学科分类知识点导航。根据每个学科下的概念或知识点进行知识导航。

3)热门专题导航。根据统计数据,自动生成热门专题,或可根据用户个性化需要进行功能定制。

6.2.1.2 知识检索

使用知识本体构建的领域查询推理系统主要包含3个部分:领域知识本体、知识本体之间的映射和内部的推理引擎。知识本体库是提供推理引擎进行推理的事实基础,知识本体之间的映射则是知识本体之间联系的桥梁,推理引擎是进行查询推理的基础。

提供一站式(跨库)检索,以多个分布式异构数据源为对象的检索系统,集成并兼容不同类型、不同渠道、不同格式的资源数据库,向用户提供统一的检索接口,只需在检索框中输入检索词,便可在多个电子资源中检索到相关信息,甚至可链接到全文。[12]

1.知识点检索(www.xing528.com)

根据以揭示各学科专业词汇(关键词、术语、主题词)所代表的概念之间的关系为基本内容的专业知识库系统,词和词之间含各种关系:同义、缩略语、译名、上下位等。可以设置检索智能扩展功能和概念导航功能。[13]检索智能扩展基于概念关系词典相关语义场运算技术,实现不同字段间的智能扩展,能够提高查准查全率,便于发现新知识,实现知识漫游服务。概念导航基于概念关系词典相近语义场运算技术,以文本和图像两种形式表现概念之间的相近关系,实现概念导航,能够提高查全率,便于发现新知识。[14]

2.字段检索

字段检索是把检索词限定在某个/些字段中,如果记录的相应字段中含有输入的检索词,则为命中记录,否则检不中。

字段可分为基本检索字段和辅助检索字段。基本检索字段反映文献内容特征,由篇名、文摘、主题词等字段中所有有意义的检索词组成。辅助检索字段反映文献外部特征,由作者、机构、文献类型、分类号、出版年等字段组成。例如,已知文献的篇名,检索时要选择篇名检索字段,之后在检索词输入框中输入检索篇名,即可进行检索。

3.主题词检索

主题词检索是指用叙词、标题词、单元词、关键词等表达信息需求而进行的检索。主题词是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。[15]

4.句子检索

句子检索是细粒度的信息检索,这种细粒度通常体现为一个知识点。句子检索的核心技术在于句子的相似度计算。根据相似度在相似算法中的级别不同,相似度可以分为局部相似度和整体相似度。句子的相似度是以局部相似度为基础的,层层递进,即句子的相似度以词语的相似度为基础,而词语的相似度又可以看作以知识元为基础。[16]

5.来源库检索

在一站式检索中,可根据来源数据库进行选择检索,并自动选择该来源数据库,提供来源可检索字段限定。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈