首页 理论教育 图书馆知识发现技术及应用研究:数据预处理

图书馆知识发现技术及应用研究:数据预处理

时间:2023-08-08 理论教育 版权反馈
【摘要】:按照刊名在Web of Science中检索每种期刊1999年到2013年共计15年发表的所有文章,文献类型为Article和Review。按照每五年为一个时间段,导出全记录数据,用于比较分析。最终分别得到1999~2003年、2004~2008年、2009~2013年,三个时间段的文献数据记录共计32 127条。图5-101999~2003年数据的78个关键词共现矩阵(部分)图5-112004~2008年的148个关键词共现矩阵(部分)图5-122009~2013年的231个关键词共现矩阵(部分)

图书馆知识发现技术及应用研究:数据预处理

静态数据是指从数据库中获取的一定时间段的文献数据,本章中的经济学数据来源是以JCR 2012版社会科学版为依据,选取经济学学科的高影响力前10%的期刊,共33种期刊。按照刊名在Web of Science中检索每种期刊1999年到2013年共计15年发表的所有文章,文献类型为Article和Review。按照每五年为一个时间段,导出全记录数据,用于比较分析。最终分别得到1999~2003年(9 590条)、2004~2008年(10 181条)、2009~2013年(12 356条),三个时间段的文献数据记录共计32 127条。

将每个时间段的经济学期刊文献关键词数据导入Bibexcel软件进行关键词词频统计,关键词按照词频降序排列,对单复数等相同意义需要合并的关键词进行合并,选取词频≥50的关键词进行分析,再对无经济学意义的关键词如model、decision、issues、determinants等进行排除。1999~2003年数据得到无重复的78个关键词,2004~2008年数据得到无重复的148个关键词,2009~2013年数据得到无重复的231个关键词。对这些关键词构建关键词共现矩阵,矩阵数值为关键词两两共现次数,构建的关键词贡献矩阵如图5-10~图5-12。

图5-10 1999~2003年数据的78个关键词共现矩阵(部分)(www.xing528.com)

图5-11 2004~2008年的148个关键词共现矩阵(部分)

图5-12 2009~2013年的231个关键词共现矩阵(部分)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈