首页 理论教育 标题法与元词法在信息检索中的应用效果及现状

标题法与元词法在信息检索中的应用效果及现状

时间:2023-07-25 理论教育 版权反馈
【摘要】:通常认为,标题法就是以标题词作为主题标识,以词表预先确定的组配方式标引和检索文献的一种主题法。标题法采用定组方式,即以词表中主标题词与副标题词的固定组配来表达某一主题概念,对于标题词表中未予规定的组配关系则不能任意采用,这样会使标引工作操作简便,误差较低。此外,元词法也缺乏必要的参照系统,无法对相关资料进行检索。目前,元词法已经被叙词法所代替。

标题法与元词法在信息检索中的应用效果及现状

1.标题法与标题词

标题法(System of Subject Heading)是最早出现的一种主题法。早在19世纪中后叶,英国的克里斯塔多罗(A. Crestadoro)和美国的克特(C. A. Cutter)等人就提出了标题法的理论方法和基本原则。通常认为,标题法就是以标题词作为主题标识,以词表预先确定的组配方式标引和检索文献的一种主题法。

所谓标题词,是指能直接表达文献主题或检索需求的、经过规范化处理的、通常是比较定型的事物名称或术语,亦称标题。标题词并不是指文献“标题” 中出现的词,而是指一种检索标识。标题词选自名词和名词性词组,而其他词类一律不采用。例如,“图书”、“信息资源”、“信息存储和检索”等都可以作为标题词。

一般按标题词在检索系统中的作用,把标题词分为主标题词(Main Heading)和副标题词(Subheading)。主标题词是指能够表达文献主题的起主导作用的关键性概念,是标题词的主体因素,一般都具有独立检索意义,通常采用大写或粗体显示的形式。例如,economicS、Information Theory等。副标题词是隶属于主标题词的下级标题词,往往是对主标题词起说明、限定、修饰或补充,主要用于通过与主标题的组配来对复合主题进行标引和检索。标题词还可以按其结构分为:单级标题、多级标题、倒置标题、限定标题和混合标题等。例如,“经济发展”是单级标题,“经济发展—铁路运输世界”是多级标题,“经济发展趋势—中国”是倒置标题,“Correlation(Statistics)”是限定标题,“心理学,医学—美国”则是混合标题。

2.标题法的主要特点

(1)标题法属于主题法,具有主题法的一般特点。比如采用受控的词语作为标识,以字顺排列标识,用参考系统表达主题概念之间的关系,从而对文献信息进行标引。

(2)标题法采用定组方式,即以词表中主标题词与副标题词的固定组配来表达某一主题概念,对于标题词表中未予规定的组配关系则不能任意采用,这样会使标引工作操作简便,误差较低。但另一方面,固定组配使标题法不能充分发挥主题法组配灵活的特点,主副标题的二元组配也难于表现专指度较深的主题概念。这样就无法从多个角度和多个因素对信息进行检索。

(3)标题法采用列举式词表,标识的含义比较明确,形式直观,选用标识相对容易;必要时,还可以自拟标题以表达新的或没有列出的主题概念,适应能力较强。但词量较大,词表的管理与修订并不容易。

3.标题词表(www.xing528.com)

标题词表是标题法的具体体现。世界上最重要的标题词表是1909年美国国会图书馆编制出版的《美国国会图书馆标题表》(Library of Congress Subject Headings,LCSH)和美国工程信息公司编制的《工程标题词表》(Subject Headings for Engineering,SHE)。

LCSH是世界上使用最广泛的主题词表,世界各国图书馆在对英文图书编目时,基本上都使用该表或参考其编目数据进行主题标引,目前有印刷版、机读版和缩微版。LCSH由主表、副表和使用说明3部分组成,款目包括标题与非标题、LCC分类号、注释、参照项等。SHE是和《工程索引》(Ei)配套使用的词表,1990年后改为《工程索引词汇表》(Ei Vocabulary)。

4.元词法

元词法(Uniterm Indexing)是指以单元词作为主题标识,通过字面组配的方式来表达文献主题的主题法。元词法脱胎于标题法,它是对标题法先组式标识进行改革而形成的一种后组式检索语言。1951年,美国陶伯(M. F. Tauber)最早系统地建立了元词法体系。

单元词是指能够表达文献主题,经过规范化处理的最基本的、字面上不能再分的词汇单元。例如,“马克思”、“图书馆”、“贸易”、“乌鲁木齐”等就属于单元词,而“知识组织”和“主题标引”就不是单元词。单元词只是构成标题的组成部分,它们本身大部分不是具体的标题,若干个单元词进行组配才能构成一个专指标识。

在使用单元词法的情况下,对复合主题的标引和检索可以通过单元词的组配来进行。例如,对“经济文献检索”这一主题,就必须采用“经济”、“文献” 和“检索”3个单元词进行标引。在一定意义上看,标题法的词组标题、倒置标题、多级标题、限定标题、混合标题等所表达的复杂概念,都可以用单元词的组配来实现,从而有效地建立词汇控制。

元词法的基本做法是:为每个元词制作一张卡片,在这张卡片上记录下所有用这一元词标引的所有文献号码,文献号是该文献在文献收藏集合中所处位置的号码;然后按元词的字顺对元词卡进行排列,组成系统。使用时,用户需要将检索提问分解成元词,并在系统中找出相应的元词卡,通过对相关卡片上的文献号进行比较,检出各个卡上同时出现的文献号,就可以查找到所需要的文献。

元词法的词表体积很小,标引专指度较高,利用对单元词的增减,可以自由地扩大、缩小或改变检索范围,检索途径也较多。但是,元词法主要采用字面组配,容易造成误差。此外,元词法也缺乏必要的参照系统,无法对相关资料进行检索。元词法的主要贡献是率先探索了后组式检索方法及组配中联号、职号的使用等问题,为叙词法的发展和使用开辟了道路。目前,元词法已经被叙词法所代替。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈