文献主题指的是文章中所论述的中心问题,是一篇文章的“核心”。文献的主题词是反映文献主旨的词语。在某一研究领域中,对共同出现在同一篇文献中的主题词频次进行分析,就能够判断其与该研究领域中主题间的关系,从而展现该领域的研究结构。若两篇论文中有两个以上相同的主题词,那可以认为这两篇论文的研究主题与内容是有关联的。为了更好地显示1993—2017年索引研究的热点变化,笔者将按照上述的发展历程分期对三个阶段的文献分别进行统计分析。
1.高频词的统计和处理
中国索引研究在1993—2001年的发轫期阶段共收录论文461篇,主题词437个;在2002—2006年的快速发展期阶段共收录论文223篇,主题词254个;在2007—2017年的发展缓慢期阶段共收录论文294篇,主题词564个。
由于部分主题词存在不统一的地方,例如同时存在“SCI”和“科学引文索引”两个主题词,其本质为一个主题词,因此在对主题词进行分析前必须先对主题词进行规范化处理。经过处理,获得三个阶段的主题词分别为430个、239个、564个。由于频次为1的主题词在各阶段主题词中的占比较大,且与其他主题词之间的关联程度不高,因此在进行可视化分析时,仅统计频次大于1的主题词,最终得到三个阶段的高频主题词统计(前20),分别如表7、表8、表9所示。
表7 1993—2001年索引研究高频主题词(前20)
表8 2002—2006年索引研究高频主题词(前20)
表9 2007—2017年索引研究高频主题词(前20)
续表
2.高频主题词的可视化分析
知识图谱是将应用数学、图形学、信息可视化技术等理论和方法,与传统科学(文献)计量学的共词、引文分析方法相结合,用可视化图谱形象地展示学科的结构与发展的研究方法。[10]绘制知识图谱的工具很多,因VOSviewer被广泛应用于各类“共现”分析,因此笔者选择用VOSviewer绘制索引研究的知识图谱。
图5 1993—2001年索引研究热点知识图谱
将1993—2001年、2002—2006年、2007—2017年的数据导入VOSviewer,结果以可视化图谱的形式展示出来,分别如图5、图6、图7所示。(www.xing528.com)
图6 2002—2006年索引研究热点知识图谱
图7 2007—2017年索引研究热点知识图谱
图5、图6、图7所示均为VOSviewer提供的4种视图中的“Label View”(标签视图)。图中一个圆圈和标签代表一个元素,圆圈的大小代表重要性的高低。拥有相同颜色的圆圈属于同一个聚类。节点间的连线表示两个节点曾经共同出现,当鼠标放在线条上时,能够显示该线条所连接的节点以及共现频次。
(1)1993—2001年高频主题词的可视化分析
由图5可以明显看出,“索引”“编制”“情报检索”“数据库”等节点所在的区域是重要的研究领域。由于“索引”“中国”属于通用词,因此在讨论研究热点时不将其纳入分析范围内。1993—2001年的索引研究热点知识图谱中包含多个聚类,以下仅分析核心且突出的聚类。
聚类1(椭圆形)位于图谱的中心位置,其他节点和聚类均与此聚类紧密相连,因此可以认为聚类1中的研究主题是索引研究的核心主题。经过分析可以了解,此聚类主要包含的主题词有“索引”“编制”“编辑工作”“年鉴”“地方志”“目录”等。除去“索引”这类通用词外,“编制”是较受关注的研究热点。索引编制的研究不仅包括索引标准、索引结构的研究,还包括索引技术的研究。“编制”成为1993—2001年的索引研究热点却在其余两个阶段的研究热点中并不突出,说明了该阶段内索引领域的研究者们对索引编制投入了大量精力,但在随后的十几年中,研究者们将眼光放得更加长远,开始将精力投入更多索引的相关研究上,这也从侧面说明了我国的索引研究是在发展的。而从索引的编制步骤来看,索引编制可以分为选题、制定计划、编制类目表、分析文献、著录与编排、编辑加工等,因此“编辑工作”“目录”也是该时期的研究热点。索引是“年鉴”“地方志”的重要组成部分,索引对于“年鉴”和“地方志”的价值和功用一直也是学者们讨论的热点,这一点在该时期的热点研究主题中得以体现。
聚类2(矩形)主要包含的主题词有“情报检索”“美国”“医学索引”等。“情报检索”又称“信息检索”,包括文献检索、计算机检索等方面。“情报检索”能成为索引研究的热点,也恰好印证了索引的其中一项重要功能,即方便、快捷地供用户检索信息。“美国”在该聚类中也较为突出,众所周知,SCI(科学引文索引)、EI(工程索引)、ISTP(科技会议录索引)是世界著名的三大科技文献检索系统,是国际公认的进行科学统计与科学评价的主要检索工具,且美国“医学索引”也是世界上使用最广、影响最大的一种医学文献检索工具,这也从一定程度上反映了我国学者开始重视对国外的索引领域进行探索和研究,极大拓展了索引研究的视野。
(2)2002—2006年高频主题词的可视化分析
如图6所示,在2002—2006年的索引研究热点知识图谱中,聚类1(矩形)处在较为核心的位置,其热点主题词包括“索引”“编纂”“年鉴”“地方志”,基本与1993—2001年中的热点研究主题相同。
聚类2(椭圆型)的热点主题词包括“科学引文索引”“期刊”“引文分析”等。科学引文索引是该聚类中的重点研究主题,也是世界著名三大科技文献检索系统中最重要的检索工具。引文分析是利用数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引证与被引证现象进行分析,进而揭示其中的数量特征和内在规律的一种文献计量分析方法。[11]因此,“引文分析”“期刊”被划归为同一聚类。
聚类3(菱形)包含“中文社会科学引文索引”“数据库”“全国报刊索引”等。中文社会科学引文索引是我国人文社会科学评价领域的标志性工程,用来检索中文社会科学领域的论文收录和文献被引用情况。“数据库”也是贯穿1993—2017年索引研究的热点,并且在2002—2006年间更加受关注,这足以体现我国索引领域的研究者们对数据库的重视。从20世纪80年代以来,我国的索引越来越多地以数据库的形式出现,因此著名索引学家张琪玉教授才会有“现代的索引就是数据库”的论断。《全国报刊索引》是我国收录报刊种类最多,内容涉及范围最广,持续出版时间最长,与新文献保持同步发展的权威性检索刊物,也是查找建国以来报刊论文资料最重要的检索工具。很明显,“全国报刊索引”也是2001—2006年我国索引研究的特色研究热点。
(3)2007—2017年高频主题词的可视化分析
如图7所示,在2007—2017年索引研究热点知识图谱中,除去与前两个阶段相同的研究主题外,聚类1(矩形)中,“影响因子”“期刊引用报告”等为较突出的主题,且均为索引资源开发与利用类主题。索引可以应用在信息服务、知识管理和资源开发与利用中,事实上不论是信息还是知识都是一种资源,对其进行有效的加工整理,再提供服务,索引的功能便体现出来。[12]通过进一步分析可以看出,资源开发与利用的主题词在前两个阶段也有出现,例如运用引文分析对期刊进行评价,但在2007—2017年这个阶段,就出现了运用影响因子和SCI进行资源开发利用。这说明该类的研究热点在不断发展,且更加地细化。
在聚类2(椭圆型)中,“技术”“思想”“中国图书馆分类法”是较为热门的主题。随着时代不断发展,各种新技术也被用于推动索引事业的发展。在“技术”类文献中,图索引技术、图像检索技术、计算机技术是研究者们较为关注的新技术,这也体现了我国的索引研究是紧跟科技发展的。“思想”这一主题词为该阶段较为突出的主题词,在这一时期,学者们着重研究钱亚新、洪业、张琪玉三人的索引思想。钱亚新先生是我国现代索引学领域的开拓者,他对索引理论、索引评论、索引编纂、汉字排检法等方面均有突出贡献,是我国索引事业的重要推动者。洪业是中国现代索引史上一位学贯中西、成就卓著的索引大家,其在各方面的思想至今仍有颇高的参考价值。而张琪玉教授,则一直被称为中国当代索引学界的泰斗。研究索引领域重要贡献者的索引思想,有助于鞭策自己,更加投身于索引事业中。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。