1.位置检索的概念
位置检索是指以原始记录中的检索词以及检索词之间的特定位置关系为对象而进行的一种检索技术,或称相邻度检索(ProxiMITy Search)。由于位置检索主要用于全文数据库中,因此也称全文检索(Full Text Searching)。位置检索最早出现在1959年美国Pittsburgh大学建立的法律信息检索系统中。此后,一些著名的信息检索软件,如RECON、ORBIT和STA IRS等,都先后借鉴了这一系统的经验,采用并发展了位置检索技术。
运用位置检索技术,可以增强选词的灵活性,部分地解决布尔逻辑解决不了的问题,使检索式更为科学合理,从而提高了信息检索的水平和筛选能力。在一定意义上讲,位置检索是一种可以不依赖于词表而直接使用自由词的检索技术,所以也称自由文本检索(Free text searching)。
2.位置检索的运算类型
不同的检索系统对位置检索的运算符和使用方法都有不同的规定,从RECON、ORBIT和STAIRS三大软件对位置检索的规定来看,位置检索的运算类型可归纳为4个级别:
(1)记录级检索:要求检索词出现在同一记录中。记录级检索用到的位置算符在DIALOG中为(C),检索式是“A (C) B”,其检索结果与使用布尔检索式“A AND B”得到的等价。
(2)字段级检索:要求检索词出现在同一字段中,可以用算符(F)、(L)进行同字段检索。(F)(Field)是DIALOG系统中同字段检索的位置算符,它表示位于此算符两侧的检索词必须同时出现在数据库记录的同一个字段中,词的前后次序可变,字段类型可用后缀符限定。例如,“? Select market? (F) information/DE, TI”表示,“market?”和“information”两个词必须同时出现在叙词或题名字段中。
(3)自然句级检索:要求参加检索运算的两个词必须出现在同一个自然句或子字段中,其先后次序不受限制。其位置算符主要是(S)(Sentence/Subfield)。例如,“(Business OR Trade OR Market) (S) (Information OR Intelligence)”这个检索式,就相当于下面6个检索式:“Business (S) Information”、“Business (S) Intelligence”、“Trade (S) Information”、“Trade (S) Intelligence”、“Market (S) Information”、“M arket (S) Intelligence”。凡是满足上述6种情况之一者,即为命中文献。(www.xing528.com)
(4)邻位检索:即要求检索词之间的相互位置满足某些条件而进行的检索。常用的邻位算符(Positional Operator)包括(W)与(nW)、(N)与(nN)和(X)与(nX)3类。
①(W)与(nW)算符:(W)是Word或W ith的缩写,表示此算符两边的检索词词序不变,两个词之间可以有一个空格或一个标点符号,n=1时,即A () B;(nW)表示两个检索词之间最多可以嵌入n个词。例如,检索“CD-ROM”就可以用“? S CD (W) ROM”作为检索式;而用“price (2W) inflation”,则可以检索出price levels and inflation。
②(N)与(nN)算符:(N)算符是Near的缩写,表示此算符两边的检索词必须紧密相连,中间不允许插入其他单词或字母,但词序不限;(nN)算符表示两个检索词之间最多可以插入n个单词,词序可以颠倒,n=1时即A (N) B。例如,检索式“econom?? (2N) recovery”,可以检出economic recovery、recovery of the economy、recovery from economic troubles等。
③(X)与(nX)算符:(X)算符要求两边的检索词完全一致,并以指定的顺序相邻,中间不允许插入任何单词或字母;而(nX)算符则表示两边的检索词之间最多可以插入n个单词,但两边的检索词必须一致。
词位置检索是一种非常有用的检索技术,它可以规定词组中各词的前后次序,替代词组中的禁用词,防止错误的搭配和输出。在DIALOG系统有9个禁用词:AND、FOR、THE 、AN 、FROM、TO 、BY、OF、W ITH。在使用一些含有禁用词的词构造检索式时,就需要用词位置算符来代替,以便检索程序扫描时的自动处理。例如,在检索“cost of living”时,就需要用以下方式表达:“? S Cost (1W) Living”。再比如,在检索“管理信息系统”方面的文献时,可以在各检索词间用位置算符(),构造如下检索式:“? S Management () Information () System”,以免输出不相关的文献。
上述4个级别的原文检索,都起着缩小检索范围的作用,是隐含的布尔逻辑AND运算。 从(C)→(F)→(S)→(N)→(W)顺序看,信息的专指度和准确性在增加,而信息的网罗度和全面性在减少。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。