首页 理论教育 面向泛在信息社会的数字馆藏长期保存策略

面向泛在信息社会的数字馆藏长期保存策略

时间:2023-07-06 理论教育 版权反馈
【摘要】:泛在信息社会,数字馆藏将成为图书馆的资源主体,数字馆藏的长期保存问题也成为图书馆管理者要重点考虑的问题。总体来说,数字馆藏长期保存是一项具有历史意义的长期的综合性工作。数字馆藏的长期保存是一个有机体,受媒体、技术、法律、经济等多方面因素的影响。

面向泛在信息社会的数字馆藏长期保存策略

(一)数字馆藏长期保存概述

数字资源所依赖的基础是网络和电子的存储媒介,而这些媒介往往不够稳定;信息技术的发展速度惊人,无论是软件还是硬件,老化的速度都很快,这些不稳定因素都造成了数字资源存储载体的极不稳定。此外,就图书馆的数字馆藏而言,目前多数情况下,各图书馆购买的都只是资源的使用权,不具备拥有权。各数据商和出版商可以终止或停止向图书馆及用户提供资源及服务。因此,数字馆藏的长期保存问题更为严重。

图书馆作为保存人类精神产品的社会机构,长期以来担负着保存文献典籍,保存和传承人类文化遗产的重要职责。进入网络时代、数字时代以来,数字馆藏逐渐成为图书馆馆藏资源的重要组成部分,有超越传统馆藏的趋势。泛在信息社会,数字馆藏将成为图书馆的资源主体,数字馆藏的长期保存问题也成为图书馆管理者要重点考虑的问题。如何确保数字馆藏存储媒体的可读性,如何保证格式化的内容被使用者很好地获取和理解,如何保证长期保存之后的数字馆藏与其所代表的原体相同……这些都成为泛在信息社会数字馆藏长期保存需要考虑的问题和实现的目标。

数字资源长期保存主要是为了解决资源的长期存储(Storage)和长期可获取(Access)问题。就存储而言,要明确保存什么,即保存的内容——资源。面对越来越丰富的海量资源,就需要衡量资源的价值,既包括当前价值也包括长期价值;考虑资源的不可替代性以及其他收藏性等因素,从而有选择地保存有价值的资源。在具体的保存过程中,除了要注意纯数据、文本内容、格式和处理信息、处理环境、版本及相关知识产权等信息元素的保存质量和效果外,还要综合考虑资金的来源、保存的对象、具体的组织者和管理者、相关政策制度、操作规范等各个环节。就长期可获取而言,则要保证经过保存后的资源具有长期的可使用性。总体来说,数字馆藏长期保存是一项具有历史意义的长期的综合性工作。它需要良好的运行模式和强有力的基础设施、政策法规做保证。

(二)数字馆藏长期保存现状分析

目前,数字馆藏的长期保存已经引起了世界各国的关注和研究,许多长期保存的政策和项目不断投入建设和完善。美国的NDIIPP(National Digital Information Infrastructure Preservation Program)项目,以全国数字资源保存所需技术、标准、统筹等问题的解决为目标,以美国国会图书馆为主,联合全国高校图书馆、研究机构、商业组织共同开展数字资源的收集和长期保存研究。英国的CEDARS(CURL Exemplars in Digital Archives)项目,是由英国高等及继续教育基金会联合信息系统委员会资助建立的高校研究图书馆联盟数字存盘项目,以解决数字资源保存过程中遇到的问题为目标,不断推进资源的长期保存工作。在欧洲,还有以荷兰为首的NEDLIB(Networked European Deposit Library)项目,还有法国、挪威、德国、葡萄牙、瑞士和意大利六国,以及KLUWER、ELSEVIER、SPRINGER-VERLAG等出版社的参与,长期致力于电子出版物的获取研究。德国的NESTOR(the Network of Expertise in Long.term Storage of Digital Resources)项目,是由德国教育和研究委员会资助、启动资金80万欧元的数字资源长期保存项目,致力于增强并推广数字资源长期保存意识和理念,引起政府对此问题的重视,解决数字资源长期保存与相关机构战略联盟中的各项问题。澳大利亚的PANDORA(Preserving and Accessing Networked Documentary Resources of Australia)项目,是一个为了保护和存取澳大利亚网络资源的项目。LOCKSS(Lots of Copies Keep Stuff Safe)项目是较为典型的代表。它以解决电子期刊长期保存与利用为目标,通过建立多个副本保证数据安全,并力求通过图书馆与出版商或其他相关行业的长期协作,共同为电子期刊的长期保存提供支持和服务。其主要的保存对象有电子期刊、报纸和政府文件等所有通过网络传递的拥有稳定URL的连续出版物。LOCKSS联盟是一个非营利的服务组织,全球已经有80多家图书馆和50多家出版商参加,我国的中科院文献情报中心和香港理工大学都已参加该项目。

我国的国家图书馆是各类信息资源的国家法定保存机构,长期致力于资源的保存,是全国的总书库。随着资源的增加和长期保存的需要,国家图书馆不断对本馆的特色馆藏进行缩微、扫描等数字化加工,力求使这些资源得以长期保存并能广泛传播使用。

目前,国家图书馆针对数字资源长期保存问题所涉及的系统架构、技术实现、标准规范、管理策略和相关法律环境等方面均进行了广泛的研究,对数字资源长期保存面临的挑战进行了多角度、多层面的探索[6]。公共图书馆则对各地方文献及数字资源的长期保存进行一定的研究和实践,对地域性资源的保存具有重要的推动作用。

高校图书馆在数字馆藏保存方面的工作,主要是针对引进数字资源的存档和自建数字资源存档;采用的方式主要有镜像模式、备份模式和裸数据模式;在引进的重要资源中,考虑长期存档的占66%,未考虑的占34%。在引进数字馆藏的过程中,各馆均希望引进长期的保存和获取权,而非单纯的访问权;但往往由于自身经费或一些版权问题等,选择远程访问的方式,尤其是一些外文数据库。总体来看,高校图书馆的数字馆藏较为丰富,多数馆在条件允许的情况下会选择获得资源的长期保存权,但依然存在一些问题,比如缺乏完整的数字资源长期保存政策和战略规划;技术上缺乏系统的研究和实施方案;引进资源方面,缺乏强制性的有效措施;自建资源方面,缺乏政策指导和统筹规划及监督;最根本的则依然是缺乏资金投入问题。

数字馆藏的长期保存是一个有机体,受媒体、技术、法律、经济等多方面因素的影响。如何统筹协调国家馆、公共馆、高校馆、专业馆等各类型图书馆以及Web信息、视频、音频、数字期刊、电子图书、数字电视等各类型资源内容,构建一个整体的数字馆藏长期保存机制和策略,将是数字馆藏长期保存发展的重要工作和方向。

(三)面向泛在信息社会的数字馆藏长期保存

长期的研究和应用虽然积累了一定的经验,但在实践过程中也暴露出了一些问题。泛在信息社会,随着信息数量的剧增、信息种类的繁复以及信息获取手段的不断革新,信息的长期保存也应适应社会的发展和需求,只有有所侧重、有所统筹,才能实现资源的有效保存和利用。全国的图书馆应和世界各国图书馆联合起来,并与其他相关系统联合协作,共同建立安全存储的网络环境,对一些缺少和没有存档的有价值的资源进行保存,尽量减少资源的丢失。对于海量资源,应该采用集中与分散相结合的方法,将同类资源集中在一起,集中保存,异地备份,分散的资源再选择各自保存。增加数字馆藏保存的资金投入,为各项技术的更新以及资源的增加、软硬件的更新提供保障。

1.数字馆藏长期保存策略

(1)资源选择

数字馆藏的保存应该是有选择性的,而不应该是盲目的,要对信息加以过滤,保存有长效价值的资源。保存所有数字资源不但没有必要,而且也很难做到,如何做到有的放矢、恰当地选择合适的资源作为长期保存的对象就成了首要问题。这就要求资源选择要有明确具体的保存方案和实施措施,确定资源的保存范围和级别。可以将数字馆藏划分为不同的等级,不同的等级决定了资源的存储介质和应履行的存储职责也不同。数字馆藏等级的划分应该有严格的标准和规范,以资源的实际价值和长效价值为准则,对不同的资源类型进行详细的界定。比如,采购的重要数字馆藏,如果是本馆单独购买的,则要针对用户群体以及资源的价值和购置经费情况,综合考虑是否选择本地长期保存;而由CALIS或其他共享组织联合购买的资源,可以分工协作保存,并做战略性存档。自建数字馆藏往往是有组织、有目的地开展建设的,多数在建设之初就会集中存档。这一类数字馆藏应做好备份工作,以防突发事件的破坏和影响。此外,网上的免费资源也要选择必需的有用资源进行规划和协作保存。

(2)技术保障

数字馆藏的长期保存不仅要防止数字资源的破坏和丢失,还要保证数字资源的长期真实性和可获取性,这就需要技术手段的支持和保护。在数字馆藏的长期保存过程中,技术因素是最不稳定的因素,一方面技术的发展速度越来越快,更新周期日益缩短,如何保证技术的长期稳定性,需要引起足够的重视;而另一方面,新技术的开发成本较高,技术的监测尤其是稳定性、应用性等方面的监测差异较大,需要长期跟踪和检测。数字馆藏常用的保存策略有复制、迁移、透明、多样、审查等,复制就是直接对资源进行备份;迁移是将资源迁移到新的系统或平台;透明是采用公开资源的编码等方式让更广泛的用户熟悉和使用,从而保证资源的利用和长效;多样就是采用多种格式和形式同时对资源进行保存,以起到备份的作用;审查则是不断地对资源进行检查,发现问题及时解决,从而确保其质量完好。针对这几种策略,图书馆可以更多地采用载体更新、原始形态保存、资源迁移和环境模仿等方式,实现对资源的复制、迁移、透明等保存。(www.xing528.com)

(3)经费管理

经费问题是数字馆藏长期保存的一个关键问题,也是困扰各机构实施长期保存的最主要因素。数字馆藏长期保存涉及资源的购入、保存、传播、维护等几大方面,而每一方面又都涉及诸多因素,其中每个环节的费用支出都不容小觑,数字馆藏长期保存的成本昂贵,许多开支也无法预算。数字馆藏长期保存工作的开展和持续离不开经费的保障和支持,这就需要在明确需求的基础上做好预算,并对具体的实施进行科学管理。

(4)法律问题

法律问题是数字图书馆建设过程中不可忽略的问题,泛在环境下也会更加凸显。数字馆藏的长期保存是一个复杂的问题,涉及的法律问题也比较多,比如版权法、合同法、署名权、著作权、呈缴制度等。有些数字资源购买的只是使用权,作为数字馆藏而言,就不具备擅自长期保存的权利,只有使用的权利。各国为了确保资源的有效收集和长期保存,多会建立呈缴制度,但呈缴制度的落实情况却不尽相同。比如,有些国家虽然有呈缴制度,但却没有很好的监督和奖惩机制,仍有很多作品没有呈缴。因此,有些国家就以法律的形式规定要向国家图书馆提交,并不断根据社会的发展和实际的需要对其进行修订和完善,这对资源的收集和长期保存有着深远的意义。

2.数字馆藏长期保存的国家战略

(1)制度的建立和完善

政策的制定是管理得以长效开展的保证。制定合理完善的长期保存政策,建立长期保存的制度机制,是数字馆藏长期保存的有力保障。首先,要明确长期保存的目标。数字馆藏的长期保存不仅要收藏、保存馆藏原物,还要保存馆藏资源的内容以及格式等,使数字资源与它所代表的原体相同,从而保证资源的可读性。其次,要提高长期保存的重视程度和在日常管理中的地位。一直以来,“收藏”都是图书馆的重要职责。数字馆藏的收藏,同样也是图书馆较为热衷的,从最初的本地收藏保存到后来的较为理性的选择性收藏,都体现了图书馆对数字馆藏收藏的重视和热衷。但对收藏的重视,并不代表对长期保存的重视。长期以来,数字馆藏如何保存等政策问题没有很好的规范;数字馆藏建立之后,也缺乏必要的长期保存措施和对保存质量的评价及监督。整个数字馆藏长期保存的管理和重视程度严重不足。再次,要建立数字馆藏保存的责任与合作机制。数字馆藏生命链上的任何环节都有可能发生丢失现象,要明确保存的责任和职责,具体而言,可以包括制作者、发行者、提供者、使用者以及监督者等方面。各自承担相应的责任,充当不同的角色,发挥不同的作用,分工协作、紧密合作,共同建立数字馆藏的长期保存机制。最后,还要有规范的操作流程和评估机制,加强监管力度,保证操作和落实的规范及效果。

(2)统筹协调保存战略

泛在信息环境下,数字资源的数量快速增加,单纯依靠单个图书馆的力量很难完成数字馆藏长期保存的任务。这就需要各图书馆以及其他相关领域共同努力、统筹协作,力求建立一个国家级的数字资源中心,还可在此基础上建立立体、分级的全国数字资源保存体系,充分保证资源的集中和分布,实现资源的长期、有效保存。在整个体系中,国家图书馆要发挥主导作用,公共图书馆、高校图书馆和其他专业图书馆应通力协作,各出版机构、数据库商以及计算机等行业也要共同为数字资源的长期保存做出相应的努力。在整个统筹协作过程中,既要考虑各方面的安全性,也要考虑用户使用的便利性,还要统筹成本和效率等问题。

(3)标准和规范

数字馆藏长期保存工作的开展,需要建立在规范的操作和统一的标准之上。各机构只有采用统一的规范和标准,才能实现共享和统筹协作,否则各自为战,自成体系,彼此之间根本无法实现共享和互通,更无从协作共享。标准和规范是数字馆藏国家战略的基础和必要环节。

(4)基础设施的保障

数字馆藏长期保存是一个长期、多层面、多领域、费用较高的工程,对基础设施的要求也比较高。只有高品质的基础设施做保障,才能确保长期保存的开展。各图书馆都要配置一些服务器,有些图书馆还要配备大量的服务器,用于数字馆藏的保存。此外,还要配备相应的系统维护人员以及其他一些基础设施,保证数字馆藏保存工作的顺利开展。随着数字资源的海量增加和存储压力的不断增大,各图书馆在数字馆藏的存储方面也都面临着一定的压力和考验。因此,部分机构开始考虑联合存储、有选择的保存,以及建立保存网络等措施,以分摊责任和费用,比如美国的NDIIPP、德国的Nestor、加拿大的Multicultural Canada及我国拟建的国外科技文献数字保存网络等;更有少数国家的保存网络,已经不再局限于本国范围,向跨国保存发展,比如荷兰的e-Depot。目前,大家已经基本达成共识,就是有选择保存和协作保存将成为泛在信息社会数字馆藏长期保存的趋势和发展方向。在此过程中,必然会涉及法律、经费、管理、技术等各方面问题的探讨和解决。

(5)技术研究与实践

长期保存技术一直是长期保存研究领域的重点。各国开展的项目主要集中在机构仓储、存档系统、网络保存等技术的研究和实践。机构仓储是对知识成果进行统一组织和管理的系统,已经有很多图书馆参与和实施。欧洲的DRIVER项目就是要构建一个交互的知识库网络;国内的中国科学院图书馆、清华大学图书馆等多家图书馆都在建立自己的机构仓储;很多图书馆也都陆续加入机构仓储的建设中。存档系统作为长期保存的基础组成部分,在各国保存活动中得以充分发展。作为拟建的NSTL数字信息资源长期保存网络的一部分,中国科学院国家科学图书馆采用Fedora作为底层存储系统,构建了电子期刊长期保存系统(CAS E-Journal Archiving System),选择一定规模的电子期刊资源作为试验资源,通过数据预处理、保存管理、数据访问服务三个主要系统功能,初步实现了数字对象的长期保存功能[7]。在泛在信息环境下,数字馆藏长期保存技术的发展有待更多层次和角度的开发和实践,从而为长期保存提供强有力的技术支撑。

数字馆藏的长期保存是一个复杂的系统工程,涉及数字资源本身以及管理、技术、经济、法律等各个方面。在泛在信息环境下,数字馆藏将以我们不可能实现的管理和保存增长率增长。同生产能力相比,保存能力则相对不足。面对分散而海量的数字资源,所需要的人力、资金和技术上的投入也会更加巨大,这就需要依靠全社会的共同努力,构筑科学合理的数字馆藏保存责任体系,建立并实施积极可靠、可持续发展的合作机制。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈