为了实现文献特征标识与检索提问标识的匹配,标引员或自动标引程序使用的标引用语和检索者使用的检索用语必须采用同一种语言,这就是检索语言。检索语言是根据文献检索的需要而编制的人工语言。文献存储时,标引者用检索语言来标引文献的各种特征,并以其为标识建立各种倒排索引文档和编制各种索引;检索时,检索者也用检索语言来表述检索提问要求。检索过程就是检索提问标识与信息特征标识相比较、相匹配的过程,两者一致则为命中。因此,检索语言是标引者和检索者共同约定使用的语言,是沟通文献存储和检索的桥梁,是文献检索得以进行的基础。
按照描述文献信息内部特征的不同,常用文献检索语言有2大类型,这2大类型有可细分为若干具体的语言,检索语言分类结构如图2-2-2所示。
图2-2-2 检索语言的分类
(1)文献的外部特征语言是文献上标明的、显而易见的特征,作为检索工具存储和检索的文献标识依据,如题名、著者、文献序号、专利号等。
(2)文献的内容特征语言比文献的外部特征语言复杂,是以对文献内容更深层次上的揭示为标识依据,如文献内容所属的学科分类、文献内容中的主题、关键词等。文献内容特征语言一般分为2大类:(https://www.xing528.com)
① 分类检索语言,是用分类号来表达各种文献内容特征的概念,以科学分类为基础,按知识门类的逻辑次序从总到分、从一般到具体的层层划分,形成一个等级结构体系。国内目前主要使用的分类语言有《中国图书馆图书分类法》(简称《中图法》,见图2-2-3)等,国外常用的有《杜威十进制分类法》《国际十进制分类法》。
② 主题检索语言,是一种用自然(规范化)的词语来表达文献内容的主题概念的直接性检索语言。如关键词语言、单元词语言、叙词语言、标题词语言等,其中关键词语言是目前网络搜索引擎使用检索语言。
检索语言在表达概念上具有单义性和惟一性,可以保证不同标引者和检索者对信息特征表达上的一致性,从而避免检索与标引之间的歧义与误差,减少误检与漏检。同时,还可使内容相同或相关的信息集中,使大量分散无序的信息系统化、有序化,便于进行有规律的检索。
图2-2-3 《中图法》结构示意图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
