首页 理论教育 截词检索:扩大范围、提高查全率

截词检索:扩大范围、提高查全率

时间:2023-07-07 理论教育 版权反馈
【摘要】:在检索中,常会遇到一些词干相同、词义相近的检索词或有英、美两国不同拼写法的词,为了减少检索词输入量,节省机时,同时又扩大检索范围,保证查全率,可使用截词检索。后截词也称右截词,前方一致,截词符位于词干的后边。中间截词也称“通用字符检索法”,截词符作为通用字符位于检索词的中间,而词的前后方一致,凡前后方一致的词,都能检出,通常用在英美对某些词的不同拼写法。n可检出woman和women。可检出computer、computers、computerize。

截词检索:扩大范围、提高查全率

在检索中,常会遇到一些词干相同、词义相近的检索词或有英、美两国不同拼写法的词,为了减少检索词输入量,节省机时,同时又扩大检索范围,保证查全率,可使用截词检索。截词符一般用“?”或“*”表示,不同系统,不同数据库,其代表的含义有所不同。计算机在检索中遇有截词符时,将不予匹配对比,只要其他部位字符匹配,即算命中。截词方式有多种,以Dialog系统为例说明如下。

(1)按截词位置可分为前截词、后截词、前后截词和中间截词。

① 前截词。

前截词也称左截词,后方一致,截词符位于词干的前边。如:?computer可检索computer、minicomputer、microcomputer等词。

② 后截词。

后截词也称右截词,前方一致,截词符位于词干的后边。如:computer?可检索computer、computers、computerize、computerized、computerization等词。

③ 前后截词。

词干的前后各有一个截词符。如:?computer?可检索computer、computers、computerize、computerized、computerization、minicomputer、minicomputers、microcomputers等词。

④ 中间截词。(www.xing528.com)

中间截词也称“通用字符检索法”,截词符作为通用字符位于检索词的中间,而词的前后方一致,凡前后方一致的词,都能检出,通常用在英美对某些词的不同拼写法。如:wom?n可检出woman和women。

(2)按截断字符数可分为有限截断和无限截断。

① 无限截断。

在检索词的词干前后,加一个“?”,表示在此位置上可能出现的字符数量不受限制,可查找词干相同的所有词。按截词符的位置分为前截词、后截词和前后截词,如前述所举例子。

② 有限截断。

在检索词的词干前后,加几个“?”,表示在此位置上最多允许出现的字符数,两个“?”之间空一格,即“? ?”,表示该位置允许出现0~1个字符,在空格前每增加一个“?”,表示增加一个字符,“?? ?”表示该位置允许出现0~2个字符,依此类推。按截词符的位置同样分为前截词、后截词和前后截词。如computer??可检出computer和computers;computer??? ?可检出computer、computers、computerize。

在WinSpirs检索系统中,无限截断符用“*”,有限截断符用“?”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈