数字文献除了在内容生产、组织利用等方面存在着一些局限性之外,更为困难的是数字文献的长期保存与持续性检索问题。这个问题涉及存储格式、管理流程、管理系统、数据交换、安全机制、应用模型、元数据等诸多复杂因素。
信息技术的快速发展,对数字文献的保存形成了巨大的挑战。
(一)保存介质与硬件设备淘汰速度快
保存数字文献的介质与实现内容读写的硬件设备,老化淘汰的速度越来越快。例如,之前,人们把一些音乐录制在黑胶唱片上,需借助特定的LP洗碟机,才能实现音乐播放。后来,随着磁带、CD、VCD、DVD的兴起,黑胶唱片逐渐淡出了人们的视线,留声唱机成了文物一般的稀有物品。多年前流行的5.25英寸和3.5英寸的软盘,今天已显得过时,我们已经难以找到相应的设备来读取这些媒介。更别说Betamax录像带和卷式影带了,那种播放设备简直是凤毛麟角!介质老化、硬件淘汰,毫无疑问是影响数字文献长期保存的一大难题。直至今天,我们还没有任何证据能够证明数字媒介的保存时间能超过100年。所以,我们必须每隔几年就要对磁性介质(计算机软盘、录音带、录像带和数据磁带等)进行复制,才能确保文献内容的可读性和完整性。
(二)格式不兼容
一个最明显的例子就是Word 2007生产的文件如果在一台只安装了Word 2003的电脑上就没办法实现读写。格式多样的电子书,需要安装相应的软件才能阅览。不同格式的数字文档,如果涉及跨库、跨平台检索等时,格式不兼容现象会明显降低检索效率。(www.xing528.com)
(三)元数据描述上的困难
互联网网页更新速度快,信息动态多变,元数据的提取、描述本来已属不易,加之知识版权状态复杂,这在很大程度上制约着内容的存取。如何判断、选择合适的动态网页来进行保存,这也是个难题。
(四)安全风险
互联网是一个庞杂的开放式网络,它将不同组织、不同地域范围、不同国家,甚至同一地区的不同层次的网络相互连接起来。网络结构日益复杂,网络安全成了日渐突出的问题。连接在网络上的数字文献,有可能受到出于各种目的的黑客攻击,越是价值高的数字信息,遭受攻击或窃取的可能性就越大。随着网络信息的指数式增长,光靠单一组织机构的存储设备,已不堪重负,许多网络信息被分散存储在“云端”设备,但即便是云技术的应用,也不能保证数据不被入侵。此外,数据管理上人为的疏忽或错误操作,也可能会导致数字文献被永久性删除。
总之,数字资源的长期保存和持续检索,还有很多问题尚待解决。目前,国内外已经有相当多一部分人在从事这方面的研究,初步形成了一些阶段性的成果。比如,2003年3月,联合国教科文组织发布的《数字遗产保存指南》,从理论与技术等多个层面对数字遗产保存的问题进行了阐述。但总体来看,涉及数字文献长期保存的相关标准为数不多,关于这方面的完善工作还有很长一段路要走。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。