(一)大数据与数字图书馆概述
1.数字图书馆
数字图书馆是相对于实体图书馆而言的,一般情况下,数字图书馆是基于实体图书馆建构的一种虚拟图书馆。数字图书馆是随着信息时代的发展而来的,属于随着信息时代的到来而到来的产物。数字图书馆是一种能够为用户提供方便、快捷、高水平的信息化服务机制的拥有多种媒体内容的数字化信息资源,它既是一种科学技术,又是一项社会事业。进一步从概念上对信息图书馆进行具体化理解数字图书馆工作的话,主要有以下两种:一是将传统纸质图书数字化,即将传统的纸质图书转化为电子版的数字图书;一是对数字图书的管理,这就涵盖对数字图书的存储、交换与流通使用。
2.大数据与数字图书馆
学术界普遍认为图书馆自建或外购的数字资源即数据、信息和知识就是图书馆的大数据。这些数据已经达到了PB 级别,符合大数据存储量上的要求。但也有反对者认为,这些数据、信息与知识在大数据被调用分析前即已存在,且一般有着详细的归类,无须进一步提取与分析,不能成为大数据。反对者认为图书馆的机器可读目录数据、读者的借阅记录、用户信息行为数据才是图书馆的大数据,虽然这些数据达不到大数据要求的存储量(PB 级以上),但是这些数据的存在与应用是符合大数据思维的,即人们可以通过大数据技术手段去探寻隐藏在图书馆的海量数据中各类数据之间规律性的关联关系。
就大数据现有的概念而言,以上两种观点都不可完全称作是图书馆的大数据,但如果将两者结合,则完全满足大数据的定义要求,且两种数据之间并不冲突。以上两种类型数据之间既有既定的,也有可变性的,但两者之前其实是存在联系的,这种联系的探求就符合大数据思维模式,数字图书馆的建设就可以根据以上数据进行挖掘与探究。而两者数据存储量之和也满足大数据对存储量上的PB 级以上的定义。
(二)大数据环境下数字图书馆的基本职能
1.数字图书馆的基本职能内涵
无论是数字图书馆还是传统类型的图书馆,基本职能都存在一个共同点:都强调对于各类资料的收藏是图书馆的基本职能。但是数字图书馆与传统图书馆基本职能的侧重点各不相同,前者指的是对数字化资料的收藏,后者指的是针对纸质材料的收藏。
2.基本职能的实现有利于文化的传承
在大数据环境下,数字化资料呈井喷式增长态势。数字化资料与纸质资料相较而言,具备三个突出优势:其一,可复制性强。要复制纸质材料的内容必须用笔逐字逐句抄写,工作量较大,耗时较长,而复制电子材料则往往效率更高,工作量较小。其二,不易毁损。纸质材料容易由于各类微生物的影响而发生霉烂变质现象,电子资料则不存在该方面风险。其三,突破了时空的桎梏。
对于纸质版图书,如果要在图书馆之外的地方学习,就必须将该书带离图书馆,如果该书只有一本或者若干本,那么学习该书的读者数量无法超过书本自身数量,如果有读者办理借阅手续将书带离图书馆,那么可供读者学习数量还将明显降低。电子图书或理论文章则无此方面限制。
3.基本职能的实现有利于提升教育与科研质量(www.xing528.com)
虽然在目前的初等与中等教育中,课内老师讲授,课外学生做题还是主要教学形式,但是在高等教育中,图书馆自学已经成为学生平时学习专业知识的重要形式、开展毕业论文学术研究的必备前提以及高层次人才开展科学研究的必要基础。图书馆的作用因而在高等教育中不可小觑,已经成为各大高校的最重要教学硬件设施之一,在大数据环境下,数字图书馆已经成为图书馆的重要组成部分。数字图书馆电子资料的收藏职能行使越充分,高校学子在学习专业知识时就有更多更前沿的专业资料可供学习,进行毕业论文学术研究时也可以更加深入、全面地掌握相关领域的理论知识与研究动态。
(三)大数据时代数字图书馆的挑战与危机
1.数字图书馆的外部竞争危机
现实生活中,学术资源上的大数据应用已经很常见。在学术、教育、文化资源上的网络资源建设发展十分迅速,这些网络资源建设商已经在资源的规模与资源的种类两个方面,远远地超过了传统的数字图书馆。并且,在大学校园中,绝大部分学生都是通过网络获得信息,而通过图书馆获得信息的学生只占极少的比重。而且,就图书馆网站和搜索引擎的利用程度来看,二者的利用率相差极大,大学生访问图书馆网站的比例远低于使用搜索引擎的使用比例,甚至有的大学生从没有去访问过图书馆网站(也就是数字图书馆)。传统的数字图书馆已经成了大数据时代背景下信息获取的最后途径。
2.数字图书馆的内部建设困境
(1)信息时代遗留问题亟待解决
由于时代的差异,传统数字图书馆在建设时难免受技术所限。同时,由于资金不足、标准不统一等许多原因,导致数字图书馆长期存在着诸如接口不统一、资源元数据描述不够、检索能力不足、文献数据相互关联性较差、互操作程度较低、资源发现和扩展能力低下等问题。这些问题从根本上阻断了各图书馆内以及图书馆之间信息的共享,也使得文献检索不便、不全。
(2)大数据时代带来新的数字图书馆建设挑战
第一,大数据技术应用为数字图书馆传统技术应用带来挑战。目前,数字图书馆在信息检索互操作方面很难将复杂数据环境(多源数据、多类型数据)下的数据价值发现与图书馆知识服务结合起来。这是因为传统的数字图书馆的检索方式主要有基于图书馆自动化系统的元数据互操作和基于二代图书馆系统的基于系统的互操作两种,这两种检索互操作方式的结合应用,也只能是有效地解决信息描述与检索能力不足的问题,而无法解决上述问题。这一问题却完全可以通过大数据思维进行剖析与处理。
第二,大数据思维为数字图书馆的用户维护带来了挑战。大数据的出现形成了有别于传统思维的大数据思维。这种在海量数据中寻找相互关系的思维逐步地使人抛弃传统的、易错的思维模式与实验方式,是一种“通过信息找人”的思维方式。传统的数字图书馆在其各项数据间都无法形成有效联系的情况下,想“通过信息找人”,即在数据中进行概率预测,为信息找用户的服务就很难达到。
对此,在大数据的背景下,传统的数字图书馆界就应当重视来自其自身内外的威胁,但有时威胁可能也是一种启示,更是一种机遇。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。