首页 理论教育 确定最佳检索词的方法

确定最佳检索词的方法

时间:2023-07-08 理论教育 版权反馈
【摘要】:确定检索词一般要从以下几个方面进行考虑:如2.3.1节所述,在对检索课题进行科学正确的分析基础上,选择核心概念,挖掘隐含概念。在确定检索用词时,检索词的数量和专指度要合适,主次分明,一般要遵循优先使用规范词,其次选用关键词,然后再根据文献情况恰当使用自由词的原则。联机检索系统和光盘检索系统一般要求使用系统特定的词表,而绝大多数的网络信息检索工具都支持自然词的检索。

确定最佳检索词的方法

检索词是编制检索策略式的基础,是表达用户信息需求的检索策略式的基本元素,也是网络信息检索系统中有关数据库进行匹配运算的基本单元。在网络信息检索系统中,检索词除了表示文献信息形式的题名、著者、出处等外部特征外,基于文献信息内容特征的检索词可分为受控词和非受控词两大类。

受控词是一种事先规范化的语言,它们取自主题词表、叙词表、分类表等。使用受控词作为最基本的检索词进行联机检索,其主要优点是能容易地选择宽度适当的概念,另一个优点是用户检索时相对容易,大大节省了联机时间。因为在标引文献时,工作人员已事先解决了自然语言中的同义词、近义词的关系,并在词表中显示了词与词之间的相互关系。因此,在选择检索词时,若用户所选的数据库具有主题词表,则一般总是优先选用受控词,这样,可以使检索提问标识和文献特征标识相一致,获得最佳检索效果。但由于受控词涉及的概念数量有限,受控词表的收词数量有限,加之结构复杂,有时已不能适应数量众多、要求各异的检索用户的信息检索需求,因此,出现了采用非受控词的自然词汇检索方法。

自然词汇是指未经规范处理的词或者词组,包括关键词和自由词,直接取自文献信息本身。关键词是文献篇名、摘要、正文中出现的具有实质意义的表达文献主题内容的词。自由词是指在检索时估计文献中可能出现、具有检索意义、未被词表收录的词,该词可以实现全文信息查找。使用自然词汇检索时,字面匹配则表示命中,由于自然词汇往往一词多义,很容易产生误检,因此,在检索时要尽量做到概念匹配。

确定检索词一般要从以下几个方面进行考虑:(www.xing528.com)

(1)如2.3.1节所述,在对检索课题进行科学正确的分析基础上,选择核心概念,挖掘隐含概念。

(2)在确定检索用词时,检索词的数量和专指度要合适,主次分明,一般要遵循优先使用规范词,其次选用关键词,然后再根据文献情况恰当使用自由词的原则。联机检索系统和光盘检索系统一般要求使用系统特定的词表,而绝大多数的网络信息检索工具都支持自然词的检索。

(3)可以随时视检索需要,调整选择检索词,灵活使用多义词、同义词、近义词等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈