1.2.3 数字图书馆的信息组织特征
自数字图书馆产生以来,相关的信息或知识如何组织以提供更有效的使用就是一个主要的、关键的并且持续不断的研究领域。
1.数字图书馆信息组织的对象不同
传统信息机构的组织对象是档案、图书资料等各种正式出版发行的出版物。这样的出版物本身有一定的规范,其产生也有一定的规律,因此对于此类信息的收集、整理和组织是线性的。数字图书馆信息组织的对象则是异构性非常强的网络信息,不同的馆藏,各种数据库等,信息量庞大,并经常处于易变性和流动性的状态。正是因为不同的信息组织对象决定了不同的信息组织方式。
2.数字图书馆的信息组织的方式不同
(1)分类方法。传统图书馆中最有效的信息组织方法就是对文献信息的分类与编目,并且随着图书馆理论的发展,文献分类方法已经形成科学的体系,广为各学科所接受。20世纪90年代中期以后,一些试验性的网络资源分类编目计划陆续启动并已取得阶段性成果,对数字图书馆中信息的组织方法起到了很好的借鉴作用。(www.xing528.com)
(2)自动分类。自动分类也称为机器分类,使用机读分类表,通过语义分析和概念分析等手段,自动发现和标引各种文献及网络信息。由于数字图书馆信息规模如此之大,完全依赖手工分类与标引是不可能的,所以尤其需要在自动化标引与组织方面进行更多的研究。
目前,国际上对自动分类的研究主要着重于对Internet资源的自动分类和标引。北欧的WAIS万维网项目就是这样一个自动分类的实验项目,由瑞典伦德大学图书馆和丹麦国立技术图书馆合作进行。WAIS是提供存取网络数据库的一个通用界面。北欧项目试图通过使用UDCC词汇和符号系统来提供对WAIS数据库的统一检索主题。叙词字段、关键词字段、主题字段以及WAILS数据库构建的关键词表中的词,是首先要抽取的对象。当UDC词汇与数据库中的词相匹配时,匹配词就被添加到关键词表中并赋予权重。在此基础上,WAIS数据库中的条目会被加上符号并链接到WAIS/UDC主题树中。
(3)主题树。主题树概念由来已久,但随着Gopher服务器的成长与发展,把某种传统分类法用作等级式主题排列的基础越来越受到人们的重视。分类法的等级结构使它们被视做能为Gopher菜单所利用的极好的“分支”机制。在万维网上,《杜威十进分类法》(DDC)被用作CyberDewey网站的基础,Internet资源都被赋予一个基于DDC的符号。用户在主题树的每一层级缩小检索范围,并逐层选择,一直到发现检索对象为止。此后,LCC被用作美国图书馆协会网站CyberStack中的基础,并成了英国“图书馆公告板”的基础。借助复杂的检索算法来运用类似分类法的等级体系结构,将成为数字图书馆中信息组织的一种有效工具。
(4)编目方法。图书馆界早在20世纪60年代就确立了数字化资源交换的国际标准,从而产生了上千万的数字化形式的编目记录。随着计算机网络技术的发展和数字图书馆的构建,编目技术也不断深入发展,在组织数字化信息方面仍起着不可替代的作用,尤其是元数据的发展。元数据就是描述数据的数据,就其本义和功能而言,可以说是电子目录,是用来揭示各类型电子文献和档案的内容与其他特性的工具。USMARC就是一种书目元数据。在USMARC中,其856字段“电子位置与存取”(Electronic Location and Access)提供了将编目记录与网上信息资源连接起来的途径。856字段主要用来存储URL地址。其内容包括:存取方式(如电子邮件、FTP、Telnet、Gopher或HTTP)、主机名称、路径、文档名称或其他可以协助用户通过网络获取电子信息的方式。随着电子资源的发展,一种为方便西文资料发掘电子资源而设的l5元素集——都柏林主体元数据产生了。它始建于1995年3月,仍在开发及扩展中。它在说明电子资源方面有六大原则:简洁,语义互通性,一致,灵活性,网上元数据的模组性,为万维网而设的元数据结构。
(5)引文分析法。引文分析法是传统书目控制中的一种特殊方法,主要是通过分析文献被引用的频率及其相互关系,来研究知识信息的创造和传播扩散。传统图书馆常常利用引文分析法来组织文献信息,达到最大的效率;在数字化环境下,利用引文分析法来研究网上信息资源的使用情况也开始为越来越多的研究者所使用。有学者记录用户点击某一网页或访问某一图书馆数据库的次数,利用用户与信息资源之间的连接来评价使用频度;有学者测度了电子期刊在印刷型文献和电子文献中被引用的频度;还有学者用引文分析法来评价公共图书馆网址,通过测算网址中包括的远程超文本链接的频度,列出了公共图书馆的核心网络资源表。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。