1.信息检索效果的概念
信息检索效果是利用检索系统或检索工具进行检索所产生的有效结果,包括两个方面:一是技术效果,主要是指检索系统的性能和服务质量,系统在满足用户的检索要求时所达到的程度;二是社会经济效果,主要是指检索系统怎样经济有效地满足检索要求,使用户或系统本身获得一定的社会效益和经济效益,可以用检索系统服务的成本和时间衡量。
2.信息检索效果的研究状况
信息检索效果直接反映了检索系统的检索性能,影响检索系统在信息市场上的竞争能力和用户的利益。因此,从20世纪50年代至70年代初,英、美等一些国家就曾对信息检索系统的检索效果进行了一系列的评价试验和研究。例如,1953年,美国文献工作公司曾对美国武装部队技术信息局(ASTIA)编制的字顺主题目录与单元词系统做了比较研究。1954年,英国信息学家克莱弗登(C.W.Cleverdon)对元词系统做了小型实验。尽管这项实验未取得具体成果,但却为另一项著名试验——“克兰菲尔德计划”(Cranfield Project)奠定了基础。
克兰菲尔德实验是信息检索发展史上的一个真正的里程碑,它把人们对信息检索系统的认知方式从思辨和推测的方式转变为一种试验和基于经验的方式。克兰菲尔德试验中包含的检索系统测试方法、数学量化思想,成为日后众多实验和操作性研究的基础。在克兰菲尔德试验思想的支配下,信息检索领域取得了一些积极的成果,如最佳匹配检索算法、查询与文献匹配、相关性理论、查全率与查准率、全文检索、化学结构式检索等方面。
克兰菲尔德实验的主要结论是:(https://www.xing528.com)
(1)采用UDC、标题语言、元词语言和专业组面分类法等4种索引方法标引了18 000篇文献,检索了1 200个课题,结果发现这4种索引语言的性能(查全率和查准率等指标)的差别很小。
(2)采用29种语言(由几种手段的不同组合而构成的)标引文献1 400篇,检索了221个课题,结果发现,如果同时考虑查全率和查准率两个指标,那么检索效果最好的语言是以文献原文中出现的、未经规范的词为基础的自然语言。
(3)评价系统性能的指标有6项,即收录范围、查全率、查准率、响应时间、用户负担和输出形式等。其中收录范围是指检索工具或数据库所涉及的学科领域和所摘录的出版物类型和数量;响应时间是指检索系统对某一命令或检索提问做出响应所需要的时间。
(4)初步发现并研究了查全率与查准率的互逆相关关系。
此外,著名的评价试验还有美国医学文献分析检索系统MEDLARS(Medical Literature Analysis and Retrieval System,1962—1971;1971年8月扩建成MEDLINE)试验,萨尔顿(G. Salton)的SMART(System for Mechanical Analysis & Retrieval of Texts)试验等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
