首页 理论教育 截词检索和精确检索技术

截词检索和精确检索技术

时间:2023-08-16 理论教育 版权反馈
【摘要】:(二)截词检索截词检索可检索词根相同、词尾不同的检索词,常用于检索词的单复数、词尾变化但词根相同的词、同一词的拼法变异等。(四)精确检索和模糊检索精确检索是指检出结果与输入的检索词组完全一致的匹配检索技术,在许多数据库中用引号来表示,如检索“belt and road”。

截词检索和精确检索技术

(一)布尔逻辑运算符

文献可能涉及一个简单的主题概念,或一个主题概念的某一侧面,也可能是由若干个概念组成的复合主题,或一个主题概念的若干个侧面。这些概念或其侧面,无疑都需要以一定的词汇或符号来表达,信息检索系统借助于布尔逻辑运算符来处理较为复杂的词间(或符号间)语义关系。

1.“逻辑与”

表达式为A AND B或A*B,检索结果中必须同时出现A和B两个检索词,可缩小检索范围,提高查准率

2.“逻辑或”

表达式为A OR B或A+B,检索结果中至少出现A、B其中的一个检索词,可扩大检索范围,提高查全率

3.“逻辑非”

表达式为A NOT B,检索结果中不出现含有B检索词的文献,通过从检索范围中去除某一部分文献的方式缩小检索范围,提高查准率。

一个检索式可以同时使用多个布尔逻辑运算符构成复杂的检索策略。不同布尔逻辑运算符的组合,其运算次序为()>NOT>AND>OR,也可用括号改变运算次序,A OR B AND C的检索结果与(A OR B)AND C的检索结果完全不同。

(二)截词检索

截词检索可检索词根相同、词尾不同的检索词,常用于检索词的单复数、词尾变化但词根相同的词、同一词的拼法变异等。不同数据库使用的截词符可能不同,常见的截词符有星号(*)、问号(?)、美元符号($)、百分号(%)和井字号(#),“*”和“%”表示任意数量的字符,“?”和“#”表示任意一个字符,“$”表示零或一个字符。

(三)限定检索

限定检索是指检索人员指定检索某一或几个字段以使检索结果更为准确,减少误检。限定检索会采用缩写形式的字段标识符(如TI表示Title,AB表示Abstract等)。

(四)精确检索和模糊检索

精确检索是指检出结果与输入的检索词组完全一致的匹配检索技术,在许多数据库中用引号来表示,如检索“belt and road”。

模糊检索允许检出结果与输入的检索词组之间存在一定的差异,如输入social science,可检索出social cognitive science和social medicine science等,只要包含social和science两个词的文献均被检索出来,并不要求social science一定按输入顺序相邻。(www.xing528.com)

(五)检索途径

1.主题词检索

主题词检索是根据文献的主题内容,通过规范化的名词、词组或术语(主题词)查找文献信息。如social service的主题词为social work。

2.关键词检索

关键词检索是从文献篇名、正文或文摘中抽出的能表达文献主要内容的单词或词组来查找文献的检索途径。关键词与主题词不同,因未经规范化处理,检索时必须同时考虑到与检索词相关的同义词、近义词等,否则,容易造成漏检。

3.题名检索

题名检索是利用题名(篇名、标题)等作为检索入口查找文献的途径,是文献检索最常用的途径之一。

4.著者检索

著者检索是根据文献上署名的著者、作者、编者的姓名查找文献的检索途径,也是目前常用的一种检索途径,当要查找某人发表的论文,而且又知道其姓名的准确书写形式(包括中文的同音字、英文的拼法等)时,利用著者检索是最快捷、准确的方式。

5.摘要检索

摘要检索是以摘要作为检索入口查找文献的途径,是文献检索最常用的途径之一。

6.引文检索

引文检索是利用引文(即论著末尾所附参考文献)这一特征作为检索入口查找文献的途径,如Web of Science,在系统评价检索中,可通过引文检索实现对纳入研究参考文献的追踪。

7.相关信息反馈检索

相关信息反馈检索是将与已检结果存在某种程度相关的文献检索出来的检索技术,多由检索系统自动进行检索。如中文科技期刊全文数据库、中国期刊全文数据库和万方数据知识服务平台学术期刊的“相似文献”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈