首页 理论教育 大数据时代图书馆信息系统的系统分析与设计的研究成果

大数据时代图书馆信息系统的系统分析与设计的研究成果

时间:2023-07-31 理论教育 版权反馈
【摘要】:在图书情报学中的文献计量有重要的意义。文献计量学是科学计量学和信息计量学的基础,主要研究数据引证。技术实践中以CSSCI来源期刊目录收录的相关数据为研究对象,分析了图书馆、情报与文献学领域的20本期刊,研究了这些期刊2011—2018年在图书馆微信服务领域的163篇文献。“基于t-SNE降维可视化分析的技术实践”部分,主要利用本书构建的图书馆信息系统导出的“双一流”建设高校关键词的词频数据,进行可视化建模研究。

大数据时代图书馆信息系统的系统分析与设计的研究成果

本章结合图书馆的馆员利用图书馆信息系统为科研处进行学科查新服务、机构数据库管理以及基金立项的培训服务中的真实场景,从学科热点预测和基金立项分布研究这两个功能点进行可视化分析实践。同时,结合图书馆进行信息计量的服务场景,以情报学的“舆情”问题为例,基于CiteSpace,对“舆情”问题进行可视化分析。

在图书情报学中的文献计量有重要的意义。文献计量学是科学计量学和信息计量学的基础,主要研究数据引证。对于文献引证的意义,上海海事大学李杰博士指出,包含以下作用:对先驱者表示崇敬;对相关工作表示赞赏,同时对同行表示尊敬;对方法或仪器设备表示认同;向读者提供阅读背景;纠正自己的工作;纠正别人的工作;批评前人的工作;支持某种论断;提醒人们注意即将发表的工作;为找到那些传播不广、索引很差又未被引证的文献提供线索;验证科学事实和数据,例如援引物理常数等;鉴别曾讨论过某个思想或概念的原始文献;鉴别某个时代的某个概念或术语的原始文献或其他著作;对别人的工作或思想提出“反证—否定”性论断;与别人论争某个观点的优先权[1]

通过分析引证数据,可以快速了解行业的发展现状、竞争格局和历史沿革。但是对海量数据进行可视化分析需要使用一些高效率工具和理论。因此,本章从“基于VOSViewer可视化分析的技术实践[2]”“基于CiteSpace的可视化分析的技术实践”“基于t-SNE降维可视化分析的技术实践”[3]和“基于长尾理论的关键词分布可视化研究”4个方面进行阐述。

其中“基于VOSViewer可视化分析的技术实践”部分,主要利用本书构建的图书馆信息系统,对图书馆领域微信服务的研究现状进行分析,了解国内目前图书馆的数字化服务(主要以微信服务关键词为例)现状,用于提高图书馆的服务水平。技术实践中以CSSCI来源期刊(2019—2020)目录收录的相关数据为研究对象,分析了图书馆、情报与文献学领域的20本期刊,研究了这些期刊2011—2018年在图书馆微信服务领域的163篇文献。通过本书构建的图书馆系统的接口导出数据后,采用文献计量学方法,以R软件和VOSViewer为技术手段,研究该领域文献的分布,主要包括合作网络和主题分布。通过共现分析和作者共现建立研究图谱,从两个维度识别该领域的研究热点,使相关学者了解该问题的研究现状。

“基于CiteSpace的可视化分析的技术实践”部分,主要利用CiteSpace对情报学中的研究热点“舆情”进行可视化分析。(www.xing528.com)

“基于t-SNE降维可视化分析的技术实践”部分,主要利用本书构建的图书馆信息系统导出的“双一流”建设高校关键词的词频数据,进行可视化建模研究。

由于建设“双一流”大学是国家的重要战略规划,而科研能力是“双一流”大学建设的重要目标,国家自然科学基金立项是科研能力的重要体现,更直观地分析“双一流”大学的科研基金立项有助于“双一流”大学的建设战略管理。本书构建的图书馆信息系统利用国家自然科学基金1998—2017年的科研立项的关键词数据,先对“双一流”A类大学进行预处理,然后利用MATLAB中t-SNE算法对结果数据进行降维及可视化。通过本书的实验,可以基于时间维度和依托单位维度,通过建模,看到过去20年内,“双一流”大学的科研基金立项关键词分布。但是本书的方法也存在一定的局限性,因为国家自然科学基金委员会的网站在不断升级,很多历史数据并不合规。本书的分析和可视化建模方法比传统基于结构化分析的方法更直观,为“双一流”大学建设的战略管理提供参考。

“基于长尾理论的关键词分布可视化研究”部分,以CSSCI为基础,以“舆情”关键词为例,得到96篇文章作为原始数据集,然后提取关键词,采集相关数据,从长尾关键词的视角研究相关分布。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈