首页 理论教育 大数据时代图书馆信息系统的技术实践与分析设计

大数据时代图书馆信息系统的技术实践与分析设计

时间:2023-07-31 理论教育 版权反馈
【摘要】:第一篇发表在表5-1期刊中并且标题包含“微信”关键词的文献是2013年发表在《情报资料》的《微信息环境下图书馆学科服务的长尾效应》[16],该文指出“图书馆应积极捕捉用户长尾”。表5-2依托单位歧义合并续表续表(二)统计分析对歧义消除后的数据进行统计分析,主要包含文献增长率、期刊录用分布、第一作者单位分布和文献元数据关键词分布这四类。表5-3文献增长率将表5-3采用R-Studio绘图,如图5-1所示。

大数据时代图书馆信息系统的技术实践与分析设计

本书的数据来自CSSCI来源期刊2019—2020目录[15],该目录共有568种期刊,其中图书馆、情报与文献领域有20本。这20本期刊是本书研究的数据来源,见表5-1。

表5-1 研究数据期刊来源

针对表5-1中的期刊,通过中国知网的数据源,在标题中搜索时同时包含关键词“微信”和“图书馆”,得到文献163篇,发表时间是2011—2018年。第一篇发表在表5-1期刊中并且标题包含“微信”关键词的文献是2013年发表在《情报资料》的《微信息环境图书馆学科服务的长尾效应》[16],该文指出“图书馆应积极捕捉用户长尾”。

(一)歧义消除

所有文献通过程序进行处理,然后进行依托单位歧义消除,例如,文献《面向知识咨询的图书馆移动服务设计与实现——以微信公共平台为例》[17]的作者单位包含“郑州大学信息管理学院,郑州大学图书馆”,统一合并为“郑州大学”,“武汉大学图书馆”合并为“武汉大学”,“中国美术学院图书馆”合并为“中国美术学院”,但是对“广东图书馆”则保留“广东图书馆”,即只保留作者依托单位的一级单位名称。

如果处理后,第一作者和第二作者的院系不同,但是一级单位名称一样,则该文献的依托单位合并为一个,不保留院系名称。这样,经过程序歧义消除后的文献依托单位见表5-2。

表5-2 依托单位歧义合并

续表

(二)统计分析

对歧义消除后的数据进行统计分析,主要包含文献增长率、期刊录用分布、第一作者单位分布和文献元数据关键词分布这四类。通过研究文献增长率来了解行业对该问题的研究分布,通过研究期刊录用分布来了解该研究问题对于哪些情况是研究热点,通过研究第一作者单位分布来了解该研究问题对于哪些研究机构是研究热点,通过研究文献元数据关键词分布来了解该研究问题的分类。具体而言,关于文献增长率的统计见表5-3。

表5-3 文献增长率

将表5-3采用R-Studio绘图,如图5-1所示。

图5-1 文献增长率

从图5-1中可以看出,最近几年,图书馆微信服务研究趋于稳定。

对期刊录用分布进行统计,得到的数据见表5-4。

表5-4 期刊录用分布

将表5-4,采用R-Studio绘图,如图5-2所示。

图5-2 期刊录用分布图

从图5-2中可以发现,有关图书馆微信服务的相关研究文献集中在《图书馆学研究》《现代情报》《图书馆情报工作》和《图书馆杂志》这4本期刊,在这4本期刊上发表的文献达到了相关论文数量的一半以上。

类似的,为了判断该研究问题是哪些单位的研究热点,本书研究了第一作者单位分布,得到的数据见表5-5。(www.xing528.com)

表5-5 第一作者单位分布

续表

从表5-5中可以发现,武汉大学、吉林大学南京大学、安徽大学关于图书馆微信服务研究的文献较多,该研究问题是以上4个大学的研究热点,本书研究的163篇文献来自116个不同的第一作者单位。

(三)网络分析

网络分析主要分为文献发表单位的合作网络和基于关键词的共现分析。其中,文献发表单位的合作网络用于分析目前该研究问题是哪些单位在联合研究,通过分析联合研究来了解不同研究单位之间如何实现研究的优势互补。基于关键词的热点分析通过统计文献元数据关键词的词频,有利于纵向了解该研究问题主要研究点的排名。而关键词的共现密度分析是指,通过对关键词共现分析生成热点密度图,有利于横向了解该研究主题的研究中心和围绕该中心的相关研究分布。

在进行文献发表单位合作网络研究时,本书对上述文献的合作单位先进行分类抽取,然后构建网络图,合作单位网络图包含两个部分,即节点和边,通过分析发现这163篇文献的作者来自134个单位,即134个节点,但是其中的合作网络只有31个(对于3个不同的合作单位拆分为第一作者单位和第二个合作单位,并且第一作者单位和第三作者单位的合作)。节点的数据见表5-6。

表5-6 合作网络节点图

单位合作关系的数据见表5-7。

表5-7 合作关系图

续表

根据表5-6和表5-7,采用R-Studio绘制合作网络,如图5-3所示。

图5-3 合作网络关系图

通过图5-3发现,对于单篇文献,大部分研究人员来自同一机构。从图中可以看到,武汉工程大学(67号节点)的合作关系最多,共合作5次(上图还包含间接合作)。

关于文献元数据关键词词频分布,本书对163篇文献的元数据关键词进行抽取,并进行分词统计,不包含关键词“微信”“图书馆”“公共图书馆”和“高校图书馆”,共443词,其中非重复词251词,得出的统计数据见表5-8。

表5-8 文献元数据的关键词分布

从表5-8中可以看出,文献的研究热点是图书馆服务的载体关键词为“微信公众平台”“移动图书馆”和“微信小程序”,主要的用户使用场景为“阅读推广”和“读者服务”。

关于关键词的密度分析,将上述163篇文献用程序生成RIS引用文件,并输入VOSViewer,研究关键词的共现密度,如图5-4所示。

图5-4 基于关键词的共现分析

通过图5-4的实验结果可以发现,微信在图书馆领域的主要研究围绕“高校图书馆”“微信公众平台”“信息服务”“阅读推广”“移动信息服务”等相关主题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈