首页 理论教育 科研文献分析系统研究:理论、方法与应用

科研文献分析系统研究:理论、方法与应用

时间:2023-11-20 理论教育 版权反馈
【摘要】:对于基于文献检索的科研文献分析系统来说,仅仅依靠检索词字符匹配返回的检索结果,存在大量的歧义、冗余或无关的结果,无法满足科研工作者的学术信息需求。此外,基于文献计量的科研文献分析系统往往只从文档层面考虑统计词汇字符的数量,而忽略了词汇在文献中的语义作用及其扮演的语义角色,使文献分析过程存在较大噪音,导致分析结果不理想。

科研文献分析系统研究:理论、方法与应用

科研文献分析系统是伴随着计算机软硬件的快速发展,为了应对海量学术资源的自动化语义分析任务,在统计学信息检索、文献计量学等学科的基础上产生的信息分析系统。[186]根据系统的主要功能,笔者将其分为基于文献检索和基于文献计量两大类。基于文献检索的科研文献分析系统主要在对数据库中存储文献的元数据进行索引的基础上,为用户提供文献检索、导航和浏览等信息服务,以及简单的基于文献元数据(如作者、发表年代等)的文献统计分析功能。例如,国外的Web of Knowledge、PubMed和国内的中国知网、维普、万方等学术数据库系统就是典型的基于文献检索的科研文献分析系统。而基于文献计量的科研文献分析系统,则可以根据用户输入的文献信息,通过分词、统计、信息抽取、共现分析、引文分析及可视化等步骤,实现对科研文献的自动化分析,帮助科研工作者迅速了解学科或领域热点领域、发展态势等,如CiteSpace、VOSviewer、BICOMB和NEViewer等属于基于文献计量的科研文献分析系统,目前被各领域学者广泛使用。

总体来说,国内外学者对于实现科研文献的自动化语义分析,已经进行了大量的尝试,并取得了一定的成果,但仍存在一些不足之处。对于基于文献检索的科研文献分析系统来说,仅仅依靠检索词字符匹配返回的检索结果,存在大量的歧义、冗余或无关的结果,无法满足科研工作者的学术信息需求。例如,某学者想在中国知网检索有关支持向量机理论的文献,在输入检索词“支持向量机”后,得到的大部分文献却是关于支持向量机在不同领域应用的文章。此外,基于文献计量的科研文献分析系统往往只从文档层面考虑统计词汇字符的数量,而忽略了词汇在文献中的语义作用及其扮演的语义角色,使文献分析过程存在较大噪音,导致分析结果不理想。(www.xing528.com)

笔者认为通过考虑学术文本词汇功能,可以较好地解决以上问题。通过词汇功能,可以指定要检索的词汇在文献中充当的语义角色,有针对性地匹配相关结果,能较大地优化传统学术数据库的检索结果,改善导航功能和浏览体验,更为细粒度地满足科研工作者的信息需求。利用词汇功能,在对文献信息进行语义组织、语义存储的基础上,来进行统计分析,可以有效地减少分析噪音,得到更为可靠的结果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈