为了实现基于词汇功能识别的科研文献分析系统,首先需要解决的问题是获取科研文献集合,并在此基础上识别和抽取研究问题词和研究方法词,生成topic-method集、研究问题集和研究方法集。本系统根据特定的科研需求制定检索策略,利用蜘蛛程序从相应的学术数据库获取科研文献集合,继而采用基于规则的词汇功能识别和抽取方法从文献的标题中抽取研究问题词和研究方法词。其次,将科研工作者的信息需求划分为检索“研究问题”和检索“研究方法”,对抽取得到的研究问题词和研究方法词分别建立索引,实现科研文献的细粒度检索,从而优化传统数据库的检索结果。对于返回的每一个具体的研究问题和研究方法,本书设计的系统可以进一步对其进行定量化的分析和度量,通过某一研究问题和研究方法所含的文献数目的时序变化来反映其研究趋势的变化;通过同一个研究问题对应的所有研究方法的文献数量排序,返回某一个研究问题最常用的研究方法;通过对同一个研究方法对应的所有研究问题的文献数量排序,返回一个研究方法最常被应用到的研究问题等。
此外,某一领域或范围内研究问题或研究方法的绝对数量若居于前列,则往往表示该研究方法或研究问题目前有较高的研究热度;同时,其随着时间的增长率可以用于预测未来的研究热点问题或方法。本系统根据获取的科研文献的题录信息(包含发表时间、作者、国家等)与抽取得到的研究问题、研究方法及topic-method集为研究热点、研究趋势的分析提供数据基础,用户可以限定时间和国家等范围,来返回相应范围中按文献记录数排序的研究问题或研究方法,即可获得热点研究问题或方法;通过生成的时间序列图,用户可以通过观察曲线的变化,来对研究问题或方法的发展趋势进行把握。(www.xing528.com)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。