首页 理论教育 主题检索语言的定义及应用

主题检索语言的定义及应用

时间:2023-08-12 理论教育 版权反馈
【摘要】:主题语言是使用自然语言字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。标题词语言有较好的通用性、直接性和专指性,但灵活性较差,适宜于从事物的主题概念出发而进行的检索。叙词语言基本成分是叙词,它概念性强、规范化程度高,是一种后组式语言,但它的组配是概念组配。单元词语言是在标题词语言基础上发展起来的。

主题检索语言的定义及应用

主题语言是使用自然语言字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言。主题语言直接代表文献内容特征和科学概念,它包括两个内容:一是指表达文献内容特征的、经过规范化了的名词术语(包括词组和短语);二是指把这些名词术语按字顺排列成主题记号表或标题词表,以此作为规范词标引和检索文献的工具。

主题语言可按规范化程度划分为规范性主题语言和非规范性主题语言两类。常见的规范性主题语言主要有标题词语言、叙词语言、单元词语言等三种。非规范化主题语言有关键词语言。

(一)标题词语言

标题词语言是以标题词作为文献内容标识和检索依据的一种检索语言,它通过主标题词和副标题词固定组配来构成检索标识。标题词语言是一种先组式语言,即在检索前已经固定好组配关系,检索按既定组配执行即可。标题词语言有较好的通用性、直接性和专指性,但灵活性较差,适宜于从事物的主题概念出发而进行的检索。

美国国会图书馆标题词表》(LCSH)、《工程索引》(EI)中的“SHE”、《科学引文索引》(SCI)中的“轮排主题索引”应用标题词语言。

(二)叙词语言

叙词语言是用规范化的名词做基础的主题语言,有一套严格完整的参照系统,参照系统把各个分散的独立的叙词在语义逻辑上构成一个有机整体。叙词语言基本成分是叙词,它概念性强、规范化程度高,是一种后组式语言,但它的组配是概念组配。

叙词语言是多种检索语言的原理和方法的综合,它不但适用于手工检索,也特别适用于计算机检索,具有良好的检索功能。STAR(美国国家航空航天局科技情报处的专业检索刊物)、INSPEC(科技文摘数据库)、EI(美国《工程索引》)、CA(《化学文摘》)以及《纽约时报主题词表》等著名检索工具都采用叙词法编排。中文叙词语言检索工具《汉语主题词表》《中国档案主题词表》也采用叙词法编排。(www.xing528.com)

(三)单元词语言

单元词语言是以单元词作为文献内容标识和检索依据的一种主题语言。单元词是不能再分解的概念单元的规范化名词,并通过若干个这种名词的字面组配去表达文献的复杂概念,是一种后组式语言。

单元词语言是在标题词语言基础上发展起来的。例如,对于“铁路运输”这一概念,标题词直接选用“铁路运输”这个词组来表达它,而单元词方法则是通过“铁路”和“运输”这两个单元词组配来表达该概念的。单元词语言多用于机械检索,适于用简单的标识和检索手段来标识信息的场合。德温特《世界专利索引(WPI)——规范化主题词表》《世界专利索引(EPI)——规范化主题词表》《化学专利单元词索引》等就是采用单元词语言词表而形成的。

(四)关键词语言

关键词是直接从文献的篇名、正文和摘要中抽出的具有表达文献主题内容、含有实质意义的语词(禁用词除外,如冠词介词副词等)。将文献中的一些主要关键词抽出作为检索标识,并以字顺排列而组成的查找文献用的语言,就叫关键词语言。

由于关键词语言是一种非控制的词,几乎所有的检索意义的信息单元都可以制作关键词。关键词语言适合于计算机自动编制各种类型的关键词索引,如《科学引文索引》等,国际互联网上搜索引擎也使用关键词。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈