首页 理论教育 微观考察索引服务对单篇文献的整序、检索和信息挖掘成果

微观考察索引服务对单篇文献的整序、检索和信息挖掘成果

时间:2023-07-30 理论教育 版权反馈
【摘要】:索引对于一般性的单篇文献来说,具有整序、检索、信息挖掘的基本功能,这也是人们对于索引服务社会的常规性认识。在这一过程中,索引员不仅要深入到文献的内容本身,还要进行高度智能化的人工分析判断,然后标引出索引词,同时排除那些无意义的文献信息。标引结果被编制成索引后,自然也成为文献信息挖掘的重要成果,人们使用索引实施检索,也就相当于在利用索引员对整个文献的信息挖掘结果。

微观考察索引服务对单篇文献的整序、检索和信息挖掘成果

索引罗马人发明,英文为index。我国的索引一词由日文音译而来,起初译为“引得”,也称为通检,后统一称为索引,意为指点、指向、标志。

我国古代就有类似于国外索引的“韵编”,产生于三国曹魏时期。民国初年我国引入西方现代索引概念和索引编制技术后,编制了较多的索引工具书,很好地支撑了民国时期的学术研究和图书出版,最为典型的就是20世纪20—30年代,“哈佛燕京引得编纂处”编纂出版了一批影响后世的中华优秀古籍索引,并在中国学术界掀起了“第一次索引运动”,大大促进了中国的索引编纂和索引事业发展。[1]

索引作为名词,是检索性工具书的一种;索引作为动词,则应该理解为图书情报资料工作和编辑出版工作的重要手段之一。索引对于一般性的单篇文献来说,具有整序、检索、信息挖掘的基本功能,这也是人们对于索引服务社会的常规性认识。

1.索引的整序

依据《英国出版物国家标准》的解释:“索引是图书、期刊及其他出版物中的语词、概念或其他项目的系统指南”。我国《辞海》关于“索引”的辞条解释是:“将图书、报刊、资料中的各种事物名称(如字、词、人名、书名、刊名、篇名、内容主题名等)分别摘录,或加注释,记明出处页数,按字顺或分类排列,附在一书之后或单独编辑成册,称为索引。”

不难看出,编制完成的索引,由一系列款目组成,这些款目不是按照它们在出版物中出现的次序列出,而是按照人们熟知的次序如字母顺序、中文笔画笔顺汉语拼音音序来排列。这就是说,索引对文献内容重新进行了一番组织,以方便人们迅速找到这些款目所指内容在出版物中的确切位置。

与目录、文摘相比,索引的整序更加科学合理,具有打破原文献的内容体系,将有实质检索意义的内容重新排列组合的意味。目录整序只是提供了文献的题名路径,是按照原有文献的页码次序排列的,其信息整序的深度大打折扣。文摘整序体现在对原有文献的信息浓缩和观点概括方面,实际上与目录相似,文摘并没有重新组织文献的信息顺序,只不过将单篇文献压缩成一条摘要记录来呈现给读者使用。

由此而言,索引的整序功能非常强大,它不仅将原有文献的信息进行了重新组合,还提供了准确、规范、宜于检索的索引词,人们依照约定俗成的排序法和预想的索引词,就可以了解文献的内容,而不必考虑原有文献的知识信息体系和内容组织次序。这也说明,索引的内容整序是深入而快捷的,可为读者进行信息查找和为学习研究提供直截了当的服务。

2.索引的检索

使用过索引的人都知道,通过索引可直接快速地检索和阅读到单篇文献中的所需内容,而不必像目录、文摘那样,先要按照目录、文摘的页码顺序一页一页地查看,直到发现相关题名或文摘后,才能去查找相关内容。

例如,通过下列的索引片段示例,读者可以不经过翻看目录,也不必阅读全文,就可以在被索引的文献中直接检索到“中国索引学会”的相关内容,同时排除了那些不需要检索和阅读的其他主题内容。(www.xing528.com)

中国索引学会 9、55、235~239

  机构设置 57

  学术活动 75、86

  研究成果 101、122~128

  研究人员 52~60

如果使用“中国索引学会”下面的索引分级标目,还可以直接检索到具有逻辑从属关系、更加专指的“机构设置”“学术活动”“研究成果”等信息内容。这与使用目录进行分级检索有异曲同工之妙,但由于索引词的专指性,使用索引的分级检索功能相较于目录更加便捷和专指,在提高检索效率、节省检索时间方面,索引的优势更加凸显。

3.索引的信息挖掘

当今社会开始注重数据挖掘、信息挖掘,索引在这方面的实际表现也是可圈可点的,而且明显强于目录和文摘。这是因为,索引提供的检索词和地址出处,直接来自于被索引文献的内容之中,这与目录仅提供题名、责任者等检索途径,文摘只提供内容摘要、方法结论等检索内容相比,索引属于“点式”检索,能够深入到文献内容的各个信息检索点,由此构成了索引对文献信息挖掘的天然优势。

对于索引的文献信息挖掘优势,笔者在国内多次索引知识讲座中提出过目录与索引的特性比较关系,即目录是“面”,索引是“点”;目录概略,索引详细;目录好看,索引好用;目录治标,索引治本。从这四方面的比较我们可以看出,索引在文献信息挖掘中可以达到专指、具体、精准的效果,这也与索引词的单一性、专指性、专业性密不可分。

从索引编制过程来分析,索引员要对一篇文献进行逐字逐句的内容分析,然后将有实质检索意义的索引词标引出来,再加上页码出处,形成一个个索引款目。编制索引的最关键环节——标引,其实就是文献信息的具体挖掘过程。在这一过程中,索引员不仅要深入到文献的内容本身,还要进行高度智能化的人工分析判断,然后标引出索引词,同时排除那些无意义的文献信息。标引结果被编制成索引后,自然也成为文献信息挖掘的重要成果,人们使用索引实施检索,也就相当于在利用索引员对整个文献的信息挖掘结果。相较于目录和文摘,不仅索引的检索点是目录的2至3倍甚至更多,而且能够达到精准和高效,正所谓一索即得。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈