首页 理论教育 位置检索算法以提高查准率

位置检索算法以提高查准率

时间:2023-07-07 理论教育 版权反馈
【摘要】:布尔算符检索时,只对检索词进行逻辑组配,未限定检索词之间的位置及检索词在记录中的位置关系。在某些情况下,若不限制检索词之间的位置关系则会造成误检,影响查准率。各检索系统使用的位置算符有所不同,Dialog系统的主要位置算符有、、、、、、等,其含义及用法如下。表示两词间可插入最多n个词,词序不限,如railwaybridge可表示railway bridge、bridge of railway、bridge of the railway等。

位置检索算法以提高查准率

布尔算符检索时,只对检索词进行逻辑组配,未限定检索词之间的位置及检索词在记录中的位置关系。在某些情况下,若不限制检索词之间的位置关系则会造成误检,影响查准率。例如检索“生物防治”的文献,若用检索式“biological*control”检索,则会将“抑制生物”(control biological)的文献也查出来,这显然不是所需文献。

各检索系统使用的位置算符有所不同,Dialog系统的主要位置算符有(W)、(nW)、(N)、(nN)、(F)、(c)、(S)等,其含义及用法如下。

(1)(W)与(nW)算符。

(W)是with的缩写,可简写为“()”,表示此算符两侧的检索词必须按此前后顺序相邻排列,词序不可变,且两词之间不许有其他的词或字母,但允许有一空格或标点符号。如biological(W)control相当于检索biological control,CD(W)ROM相当于检索CD ROM或CD-ROM。(nW)是n words的缩写,表示此算符两侧的检索词之间允许插入最多n个词,且词序不可变。如wear(1W)material相当于检索wear materials、wear of materials等词。

(2)(N)和(nN)算符。

(N)是near的缩写,表示此算符两侧的检索词必须相邻,词序不限,词间不允许插入其他词或字母,但允许有一空格或标点符号。(nN)表示两词间可插入最多n个词,词序不限,如railway(2N)bridge可表示railway bridge、bridge of railway、bridge of the railway等。

(3)(F)算符。

(F)是field的缩写,表示此算符两侧的检索词必须同时出现在文献记录的同一个字段内,两词的词序不限,两词间插入词的数量不限。用此算符时须指定所要查找的字段,如题名字段、文摘字段、叙词字段等。例如digital (F)computer/TI表示在题名字段(TI)中同时出现这两个检索词的才算命中文献。

(4)(C)算符。

(C)是citation的缩写,表示两个检索词只需同时在同一条文献记录内即为命中,其词序、词间插入的词数和出现的字段均不限。(www.xing528.com)

(5)(S)算符。

(S)是sentence的缩写,表示两个检索词须同时出现在同一句子式短语中,两词的词序不限,两词间插入词的数量不限。

在WinSpirs检索系统中,位置算符只有near和with两个,其含义如下:

(1)near。

限定两个检索词在同一个句子中,相当于Dialog中的(S)算符。

(2)with。

限定两个检索词在同一个字段中,相当于Dialog中的(F)算符。

不同的检索系统使用的位置算符有所不同,各种算符的含义也有所不同,使用时应注意区别。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈