检索语言是用于文献信息的存储和检索的。对于非文献信息,若运用检索语言,就要把非文献信息转换成文献信息后再使用。因此,在检索语言中,我们主要介绍文献信息检索语言。
就文献检索语言而言,它主要反映的是文献信息的内容特征和表象特征。在这些特征中,外表特征如书(篇)名、著者、号码等,其检索语言简单易懂,又属于非主要检索途径,故在检索语言中一般不予专门论述。而表述文献信息内容特征的检索语言,由于其使用频繁而又非常重要,所以检索语言一般均指表述文献信息内容特征的语言。信息检索语言可以根据不同的角度进行划分,这里简单介绍几种常用的划分方法。
1.按组配方式可以划分为先组式检索语言和后组式检索语言
(1)先组式检索语言。
先组式检索语言是指在检索之前,表述文献主题概念的标识已经事先拟订好的检索语言。先组式语言又分为定组型和散组型两种。定组型是指表述文献主题概念的标识,在编制检索语言词表时已经预先固定组配;散组型是指表述文献主题概念的标识,在编制检索语言词表时并不预先固定组配,而是在标引文献时,根据文献信息的主题内容予以组配,检索阶段也通过相同的组配与之匹配。主题检索语言中的标题词语属于先组定组型检索语言,而叙词语言当作标题词语言使用时,属于先组散组型检索语言。
(2)后组式检索语言。
它是指表达文献信息主题概念的标识,在编制检索语言词表和标引文献时,不预先固定组配,而是在检索进行时根据检索的实际需要,按照组配规则临时进行组配的检索语言。叙词语言则属于此种类型。
2.按检索语言的结构原理可以划分为分类语言、主题语言、代码语言
(1)分类语言。
分类语言是检索语言的一种主要类型,它包括体系分类语言、组面分类语言和混合分类语言三种形式。分类检索语言用分类号表达各种概念,将各种概念按学科性质进行系统排列。它集中体现学科的系统性,反映事物的从属、派生关系,由上至下,从总体到局部层层展开,构成一种等级体系,由类目或相对应的类号来表达各种概念,成为一个完整的分类类目表。
体系分类语言是一种传统的分类语言,具有列举式类目、分类符号标识、登记制结构、直线性序列等特点。体系分类语言由于在编制体系分类表时列举了所有类目,并加以固定组配,因此它是一种先组式检索语言。
组面分类语言是在体系分类语言的基础上发展起来的一种检索语言。它克服了体系分类法中不能容纳主体概念发展的局限性,以及直线性序列造成的集中与分散的矛盾。组面分类语言按照学科范畴分为若干组面,每个组面包括若干类目,每个类目表示一个简单的主题概念,用分类符号作为组面和类目的标记。在标引文献信息时,按文献信息的主题概念,选择相应的类目进行组配,组配后分类号所表达的概念与文献信息的主题概念基本一致。组面分类语言是在标引文献的时候进行组配的,因此它也是一种先组式检索语言。
混合分类语言是介于上述两种分类法之间的检索语言。它是在应用概念划分与概括原理和概念分析与综合的原理的基础上编制的分类法。实际上,现代的文献分类法几乎都要应用概念划分的概括、概念分析和综合的原理,只是应用的程度不同而已。因此,混合分类法具有较强的实用性。
等级体系分类法是图书信息界普遍使用的逻辑标识系统。我国的图书情报机构目前采用的体系分类法主要有《中国图书馆图书分类法》《中国科学院图书馆图书分类法》等。《中国图书馆图书分类法》是我国应用最广泛的图书分类法,它把人类知识和事物划分为五个基本部类,即:①马列主义、毛泽东思想、邓小平理论;②哲学、宗教;③社会科学;④自然科学;⑤综合性图书。在基本部类的基础上又划分出22个基本大类,作为分类法的第一级类目,如表3-1所示。
表3-1 《中国图书馆图书分类法》
续表(www.xing528.com)
在《中国图书馆图书分类法》中,以大写字母表示一级类目,以数字表示二级和二级以下的类目。由于“工业技术”大类(T)的内容复杂,所以专门设计了双字母的二级类目,如表3-2所示。
表3-2 带有双字母的二级类目
以TP类的细分方式为例,可以看出其规律性,如表3-3所示。
表3-3 TP类的细分
从以上表格可以看出,对类目的科学划分,就把复杂、庞大的类目按学科系统排列成一个严密的分类体系,为用户提供了从学科角度检索信息的途径。
(2)主题语言。
主题检索语言是用规范化的自然语言作为揭示文献信息主题的标目,并按照字顺组成文献信息或检索文献信息的一种检索语言。它用主题词汇来表达各种概念,并忽略概念的相关关系而按字顺进行排列,这样表达的概念较为准确。主题词表通过参照系统反映词汇之间的关系,具有较好的灵活性和专指性。它通常包括标题词语言、单元词语言、叙词语言和关键词语言四种形式。
标题词语言是用规范化的名词标引文献信息的主题概论。在编制主题词时,往往列举所有作为标题词的规范化的名词,并按字顺排列,所以标题词语言又称字顺主题分类法语言。标题词中的主题词和副标题词在编表时已固定组配,所以它是一种先组式检索语言。
单元词语言是在标题词语言的基础上发展起来的,目的是改革标题词语言的先组式标识,采用最小的字面单元——单元词来标引文献信息,即通过单元词的组配来检索文献信息。它是主题词语言中最早出现的一种后组式检索语言。
叙词语言是以规范化的中词作为基础的一种检索语言,它吸收了多种检索语言的长处。因此,叙词语言是一种性能较为优异、检索效率较为理想的检索语言类型,叙词语言在检索时,根据用户的需要,组配规划临时进行组配,因此它是一种后组式的检索语言。值得注意的是,在叙词表作为手工检索使用时,实际上它成了先组式检索语言。
关键词语言是直接选用文献信息标题或内容中具有实质意义的自然语言,作为标引和检索文献信息主题概念的检索语言。它是未规范化的自然语言,若按严格的主题检索语言的意义来衡量,是不属于主题检索语言范畴的,但是其在文献信息标引和检索中起着主题法检索语言的作用,因此它是一种准主题检索语言。
在上述两种形式的基础上,可以引申出一种新的形式,即分类主题一体化语言。分类语言和主题语言分别是以分类号和主题词反映文献信息的主题内容的,为了在文献信息标引时使分类标引和主题标引能够一次性完成,故而产生了分类主题一体化语言。分类主题一体化语言是指在一个检索语言系统中(或由各原理独立的检索语言合成的系统),对它们的分类表部和叙词表部的术语、参照、标识、索引实行统一控制,从而能够满足分类标引与主题标引的需要,简称一体化检索或一体化词表,国外称为分类法或叙词表系统。
(3)代码语言。
代码检索语言一般针对事物某一方面的特征,用某种代码系统来加以标引和排列,如化合物的分子式索引系统等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。