由于图书馆系统是建立在顶级关系数据库管理系统(relational database management system,RDBMS)上的,因此,找到一种存储数据的工具、一种用于为其建立索引的工具,以及另一种针对它运行查询的工具,对图书馆而言是有意义的。除了这些传统功能之外,还可以添加更多功能,例如,利用图书馆大数据,也许可以为当地企业和公众提供咨询,帮助企业家寻求市场信息,帮助学生运行项目的统计数据,帮助研究人员有效地管理大型数据集。显然,这些功能类似于挖掘财务数据或交易数据。由于用户正在使用图书馆进行参考搜索,因此收集到的数据非常有用,挖掘用户行为将有助于提供更好的服务。这意味着可以实现数据挖掘的两个方面:一方面是使用存储在库中的数据,另一方面是收集用户在使用图书馆服务的过程中产生的数据。以下列出几种图情与大数据融合的发展模式。
1)数据驱动
以数据为基础进行决策或推荐的数据驱动方法是许多领域中常用的方法。在资源为“王”的年代,谁占有的资源多就意味着谁有更多的服务能力。图书馆累积了大量的资源数据和用户数据,不仅有正规的资源数据和业务数据,如书目数据、各类资源的二次文献数据、活动数据等,而且有正在产生的、由用户创造的数据内容,这些数据种类繁多、类型复杂,具有很强的生命力。例如,美国哈佛大学图书馆把大数据的服务引入图书馆,将图书馆大数据向读者公布,共有1 200多万种资料,包括书目数据、地图、手稿、音频、视频等,并提供下载服务,帮助图书馆实现知识的扩展和满足用户的知识服务需求。这些数据虽然是图书馆最显著的优势,然而长期以来由于长尾效应而使绝大多数资源难以激活,但通过大数据服务,能够使这些海量资源以多角度聚类,以不同方式呈现,同时通过挖掘用户的行为和喜好,实现用户细分,从而达到精准匹配。海量数据是提供大数据服务的基础,这种从数据资源优势入手提供大数据应用的模式可以称之为数据驱动型模式。
2)云平台驱动
平台化是网络服务的新模式,它顺应了网络技术开放、互联的潮流,具有强大的功能性、适应性和灵活性。目前世界上最有影响力的四家与互联网相关的公司——谷歌(Google)、亚马逊(Amazon)、脸书(Facebook)和苹果(Apple)都不约而同地采用了平台化的架构和服务理念。作为最早推进信息化行业之一的图书馆界在近几年也一直在推进平台化的工作。David Weinberger最早将平台化的理念引入图书馆界,他提出图书馆应作为一个服务平台对所有人开放,让用户获取图书馆所有信息,包括数字内容、元数据,以及用户使用数据和社交互动的数据。用户可以在平台上构建新的产品和服务,并且图书馆应将平台整合到整个互联网生态系统中。在此理念指导下,大英图书馆(British Library)、美国国会图书馆(Library of Congress)、欧洲数字图书馆(European Library)和联机计算机图书馆中心(Online Computer Library Center,OCLC)等都在开放书目数据和各种多媒体资源的元数据,用关联数据的方式进行发布,建立网络平台。
3)整体驱动
2015年,中国国务院发布的《促进大数据发展行动纲要》中指出“推动大数据与云计算、物联网、移动互联网等新一代信息技术融合发展,探索大数据与传统产业协同发展的新业态、新模式,促进传统产业转型升级和新兴产业发展,培育新的经济增长点”。随着现代信息技术发展日新月异,智能手机使用普及,射频识别(radio frequency identification,RFID)、移动定位、移动浏览器、人脸识别和动作感知等技术层出不穷,使得图情领域提供基于移动端的服务的门槛越来越低。图书馆可以将拥有的资源通过移动互联网直接推送到用户的手机或平板电脑上;可以利用门禁人脸识别系统计算每天进出机构的人数和流量,及时调整服务时间;可以通过大数据研究分析用户偏好,调整服务内容和方式,满足用户需求;可以通过分析用户停留的时间和动作来判断用户感兴趣的领域。广东省佛山市盐田区图书馆打造的“智慧图书馆服务平台”就是借助信息可视化、大数据、云计算、物联网、互联网等技术,搭建智能化、网络化、数字化、一体化的图书馆智慧平台,为读者提供全新的服务模式。图书馆利用现代信息技术不断改进传统服务并为用户提供各种新型服务的行为,可以将其归纳总结为综合驱动型模式。
4)用户产生内容(www.xing528.com)
在互联网的冲击下,用户产生内容(user generated content,UGC)迅速发展。社交网络已经不断普及并深入人心,用户可以在网络上随时随地分享内容,由此产生了海量的用户数据。这些数据并不是我们想象中的那样冷冰冰、枯燥的数据,而是活生生、有趣的数据;这些数据不同于以往单纯的数字,它们声色结合、图文并茂。在UGC的基础上,借助大数据技术,将会使得各类服务有的放矢,人们的需求也会不断得到满足。
在国外已形成的一种共识是图书馆、博物馆、文化馆甚至美术馆都被看作是同一类的文化继承机构,有着相似的资源管理和服务需求,它们之间的界线越来越模糊。美国纽约的市民卡就是典型的代表,所有14岁以上的纽约市居民,包括无证移民等,均可申请办理这张形同身份证的卡片。持卡人可免费参观博物馆、音乐厅、演艺中心、动植物园等,可凭此卡享受纽约市内所有公共图书馆的借阅服务,还可凭此卡在购买电影、演出、体育赛事和主题公园门票时享受折扣。用户通过一张卡片享受所有公共文化服务的同时,也在为文化机构创造和提供用户行为数据。当用户的卡片使用数据量达到一定规模后,文化机构可通过大数据技术分析用户的使用偏好,为用户推送感兴趣的资源。例如,可通过分析用户在博物馆和美术馆参观的展览,向用户推送与展览相关的图书资源,反之,用户在图书馆借阅某个相关主题的图书后,文化机构可以向该用户推荐相关的展品和美术作品。大数据颠覆了公共文化机构从资源到服务全程单向提供的传统流程,变成直接由需求驱动,由用户有意识地创造和提供内容,或者将用户在使用公共文化服务的过程中自然产生的行为数据作为资源内容,这样就解决了公共文化服务发展的动力机制问题。这样一种形态可称为用户产生内容模式。
5)个性化和精准化
为用户提供受欢迎的个性化服务一直是图书馆追求的目标之一。身处信息时代,各大文化机构有更多的机会去了解用户,甚至可能比用户自己还要了解自己的需求。大数据的支持让昔日的个性化服务有了更好的延伸和更大的价值。
一些有条件的图书馆首先借助大数据技术开展个性化的精准服务。“我的图书馆”服务就是以用户为核心、以个性化选择为界面的图书馆信息资源搜集提供方式,是根据用户个性特征进行的、有针对性的图书馆信息服务。盐田区智慧图书馆对所有资源建立了有序的分类和标引,利用大数据技术分析了读者的阅读历史和爱好后,可以提供更丰富的个性化资源定制服务,根据读者所处的位置并结合图书馆目前的资源状态、服务内容进行推送,空调、通风、灯光系统也可随人流量的多少而进行调节。
中国的图情服务面向的群体较为复杂。东部经济发达地区和中西部经济欠发达地区的需求不同,相同地区中,受教育程度较高和较低的不同人群的需求也会不同。因此,在大数据技术蓬勃发展的条件下,利用大数据为不同的地区和人群提供个性化和精准化的服务是趋势所向。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。