首页 理论教育 计算机检索方法:积木法,信息检索与利用教程

计算机检索方法:积木法,信息检索与利用教程

时间:2023-07-25 理论教育 版权反馈
【摘要】:机检方法是指在计算机检索条件下使用的方法。表4.1给出了“用户需要”的积木法表示。在积木法实施过程中,最好将最专指的组面和最少文献登录数的组面优先处理,也可以考虑整个检索式的成批输入,以便缩短计算机的匹配时间。

计算机检索方法:积木法,信息检索与利用教程

机检方法是指在计算机检索条件下使用的方法。这里所说的机检方法主要是根据美国学者查尔斯·鲍恩(Charles Bourne)提出的5种联机检索策略演变而来的。

1.积木法(Building-block)

积木法是指把一个检索课题分成若干组面,先检索各个组面(组面检索),然后再进行组配检索的检索方法。检索时,先把检索课题剖析成若干概念面,在每个概念面中尽可能多的列举出相关词、同义词或近义词,并用布尔逻辑OR将代表检索提问中每个概念的词语连成一个个分检索式,然后再用布尔逻辑AND将所有概念面的分检索式连接起来,构成一个总检索式,类似于把各种木片拼成图案。表4.1给出了“用户需要”的积木法表示。

表4.1 使用积木法表示用户需要

相应的,总检索式可以表示成:(用户OR顾客OR消费者OR主顾) AND (需要OR要求OR需求OR希望)。

积木法的优点是能够提供比较清晰的检索逻辑式,以便以后回顾和进行检索式的保留与调用。缺点是耗费较多的存储容量和联机时间。在积木法实施过程中,最好将最专指的组面和最少文献登录数的组面优先处理,也可以考虑整个检索式的成批输入,以便缩短计算机的匹配时间。

2.引文珠串增长法(Citation Pearl-grow ing)

在机检条件下,逐步扩大检索范围,使被检文献量逐步增长的检索方法。具体而言,就是从最专指的检索词开始检索,查出少量文献(至少1篇文献);然后检查这些文献中使用的标引词和自由词,选择其中重要的补充到检索式中,再进行检索,从而查出更多的文献,如此重复循环,使被检文献量逐步增长,直到取得满意结果为止。(www.xing528.com)

引文珠串增长法的优点是能够充分地利用联机系统的交互能力,以动态的、实验性的方法去导出合适的检索式,提高检索的网罗度;缺点是检索过程会耗费较长的机时。

3.逐次蒸馏法(Successive Fractions)

在机检条件下,逐步缩小检索范围,提高专指度的检索方法。即先进行较粗泛的检索,得到一个规模较大的命中文献集合;然后利用各种条件,以文献出版年份、文种、文献类型以及更为专指的概念组配的叙词等,以逻辑的方式对原来的命中文献集合进行缩小,逐次分割,类似剥笋一样,逐步逼近核心部分,从而获得一个可以接受的、数量适宜的命中文献集合。

逐次蒸馏法的优点是漏检较少,可以随时根据文献量的多少而灵活掌握限制条件,检索比较主动;缺点也是耗费较多的机时。

4.最专指面优先法(Most Specific Facet First)

在检索时,首先选择最专指的概念组面进行检索,如果检索命中的文献相当少,那么其他概念组面就不再加入到检索提问式中去;如果检索命中的文献较多,就需要把其他概念组面加入到检索提问式中,以提高查准率。显然,各概念面在检索式中的关系是逻辑与的关系。

5.最低登录面优先法(Lowest Postings Facet First)

所谓最低登录量,是指一个索引词在标引中的使用次数。它一般记录在数据库词表中,也可以显示在检索终端设备上。登录量数据在检索中很有价值,它可以帮助检索者根据特定的检索策略估算出他将会查出多少命中文献,或者至少能告诉他可能查出的最大文献量是多少。“最低登录面优先”就是先根据词的登录量值,找出登录量最少的那个概念面,然后以此作为检索入口开始检索。如果命中文献数量相当少,就不必再继续检索其他的面。例如,检索题目为“网络经济学在经济学研究中的地位”,很显然,“网络经济学”的登录量比“经济学”的登录量要低,检索时则应首先从“网络经济学”这一概念着手进行。

以上两种检索策略具有相似性,即都是通过检索最低限度的概念组面,达到减少机时,降低检索费用,并尽可能检出相对多一些的相关文献。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈