在古代,书籍内容篇幅较短,读者可以快速翻阅查找书籍内容,对检索工具的需求并不迫切。随着书籍内容的增长,人们难以通过快速翻阅查找内容,帮助人们检索内容的索引便出现了。世界上最早的索引可以追溯到公元6—9世纪编制的《圣经》索引。[4]《圣经》大约有100万字,多达数十卷。正常人顺序浏览完一遍也需要几天时间,理解并查找特定内容是对人类认知能力的挑战。编制《圣经》索引成为了解决上述问题的方法,《圣经》索引成为了提升查阅书中人物、故事、地点等内容的有效工具。我国的索引萌芽于古代。最早严格意义上的索引通常可追溯到韵书的编写,比如宋初的《礼部韵略》、明代洪武年间的《洪武正韵》。韵书把汉字按照字音分韵编排,实质上构成了检索汉字的一种索引结构。这种在一本书或一套书的附录中,供读者快速查询的索引仍然在当前著作、词典、年鉴等文献中普遍存在。
随着科学研究的发展,论文逐渐成为发表科研成果的形式之一。美国情报学家尤金·加菲尔德于1955年提出了通过文献引用关系来帮助科学家识别感兴趣论文的设想,并于1961年创办了美国科学信息研究所(Institute for Scientific Information,ISI)。ISI于1964年开始出版科学引文索引(Science Citation Index,SCI)。随后还产生了工程索引(the Engineering Index,EI),社会科学引文索引(Social Science Citation Index,SSCI)等索引,这些索引已经成为国际科研信息检索的常用平台和科研评价的事实标准。[5]我国的人文社会科学论文有其独特性,引用文献类型甚为复杂,大量引用存在于文中注、脚注、尾注等,在自然科学论文中极为少见。自然科学引文索引管理办法通常难以直接应用于我国人文社会科学的引文管理。因此,我国独立创建了中国社会科学引文索引[6](Chinese Social Science Citation Index,CSSCI),被该索引收录的期刊俗称C刊。该索引已经成为我国人文社会科学研究成果的重要评价标准。这类索引的初衷是发挥平台作用,帮助科研人员检索到感兴趣的论文,主要检索点包括作者、机构、题名等。随后逐渐被用作科研成果评价的工具。这类索引与书后索引的不同之处在于检索对象由书籍内容变为论文。
随着计算机技术的发展和网络技术的兴起,互联网成为了人类社会发展史上继图书馆之后又一个海量信息聚集地。随着互联网信息的指数级增长,信息的获取成为了又一难题。起初的设计思路是仿照图书馆管理图书办法来构建分类目录,与之对应的产品是华人杨致远等创办的雅虎网站,该网站本质上是一个分类目录,用户通过目录检索网络信息。纸质图书的增长速度通常是线性的,数字时代的网络信息增长符合摩尔定律,呈指数级增长。这种指数级增长带来的规模效应使得分类目录难以有效管理海量网络信息,以谷歌为代表的计算机索引应运而生。这种计算机索引本质上与文后索引类似,通过对网页内容的分析提取出索引词,构建索引词与网页之间的关联。用户通过关键词(索引词)表达检索需求,谷歌向用户提供索引词指向的所有网页。这种索引同时融入了引文索引的论文评价思路,通过网页之间的互引关系计算网页排名。这种计算网页排名的方法进一步帮助用户缩小检索信息的范围。这类计算机索引本质上与文后索引和引文索引具有相同的特点,都是为用户提供的信息检索工具,只是在实现方式更依赖于计算机技术。
除了上述三种索引,生活中也处处有索引。最为常见的索引是医院、学校、政府、商场等大楼比如大楼入口处通常会有一张索引图,用于指示大楼的楼层分布;在电梯入口或电梯内部也会出现楼层的房间分布图。日常办公中我们会用到索引贴,通过对索引贴标注文字或符号,贴到文档特定页码,便于查找;公园里的索引指示牌也是一种引导游客走向正确目的地的索引。广义地讲,一切引导人们找到正确事物的符号均可称为索引。
通过索引的发展脉络可以看出,上述四类索引都具有相同的功能——指示和查找。索引的英文index,本意就是指向,引导用户查找所需事物。用户通过书后附录中的索引找到正文中需要的内容;通过论文引文索引找到感兴趣的论文;通过关键词索引找到需要的网页;通过路标找到正确的地理位置。除了具有相同的功能,上述四类索引还具有另一个共同的特点——索引词与查找对象之间分离,通过显性的或隐性的关系建立联系。书后索引的索引词与正文内容通过页码建立联系,引文索引通过索引词与论文建立联系,计算机索引通过计算机内部维护的索引词与网页之间的关系建立联系,路标等通过潜在的空间关系与物理位置建立联系。(www.xing528.com)
2.索引的定义
《现代汉语词典(第六版)》将索引定义为:“把书刊中的项目或内容摘要记录下来,每条下标注出处页码,按一定次序排列,供人查阅的资料。”词典把索引定义局限在书刊项目和内容,仅包含了书后索引一种,并未将引文索引、计算机索引以及生活中的索引包含在内,较为狭隘。
《索引编制规则(总则)》将索引定义为:“指向文献或文献集合中的概念、语词及其他项目等的信息检索工具,由一系列款目及参照组成,索引款目不按照文献或文献集合自身的次序排列,而是按照字顺或其它可见的顺序编排。”该定义认为索引是一种信息检索工具,揭示了索引的指向功能和检索本质。但是将检索的对象限定在文献或文献集合缩小了索引对象的范围。通过对索引历史的回顾可以发现,索引的对象不仅包括文献,而且包含现实世界的具体实物。《索引编制规则(总则)》编制的主要目的是为文献索引的编制提供规范,尤其是对图书、论文等传统知识型文献的索引手工编制提供参考,并未考虑计算机索引和生活中索引的编制。
本文提出一种广义索引定义,认为索引是一种帮助人们查找事物的符号系统,这个符号系统由索引符号和索引地址组成。这里的事物既包括文献、论文、网页等信息,也包括楼层、房间、道路等实物。索引符号揭示被查找事物内部或外部特征,主要包括语言符号,也可以是线条、图形、图标和图案等。文后索引、引文索引和计算机索引的索引符号主要由语言符号构成,也包括公式等符号。生活中的索引符号较为分散,语言文字可以成为索引符号,图形图标、方向箭头灯也可构成索引符号,比如指引道路方向的路标索引就以箭头作为索引符号。索引地址帮助用户找到检索对象。文献索引中的索引地址主要是页码,计算机中的索引地址通常为URL,生活索引的索引地址通常不会明确给出,而是用户根据空间自行分析判断。比如楼层各房间的布局图,各个房间的地址可以通过空间格局自行判断。在这种广义定义之下,索引的本质特征仍然是一种检索工具,但并不局限于对信息的检索,而是对一切可检索、可编制事物的检索。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。