目前国际上直接研究词汇功能的相关文献还较少,最早的研究始于2009年,日本学者Knodo等[8]将科研文献标题中的词汇功能分为了“领域(head)”“问题(goal)”“方法(method)”及“其他(other)”,以探讨如何从一个特定研究领域里掌握研究技术的发展趋势。随后,不同的学者对学术文本中词汇的功能进行了不同的划分,同时进行了相应词汇功能识别实验,但都没有对学术文本词汇功能给出明确的定义,具体见表9-1。例如,2010年Knodo等[9]进一步将词汇功能划分为“技术(technology)”及“效果(effect)”两类,从科研文献的标题和摘要中进行识别以自动生成技术趋势图。2013年,Tsai等[11]将词汇功能划分为“技术(technique)”和“应用(application)”来对学术文本进行概念分析。2015年,程齐凯[134]对学术文本词汇功能进行了明确定义,并构建了较为完善的学术文本词汇功能框架,将词汇功能划分为“领域无关词汇功能”及“领域相关词汇功能”。其中,“领域无关词汇功能”分为“研究问题”和“研究方法”两大类,又细分为“核心问题”和“核心方法”等六小类,并基于条件随机场和机器学习排序等方法对学术词汇功能识别进行了探讨,取得了良好的识别效果。
综上所述,“词汇功能”在国际学术界属于一个较新的研究问题。对于科研文献中词汇功能的识别,研究人员已经做了一些有效的尝试,但整体上相关研究数量仍然较少,仅11篇;此外,关于对学术文本的词汇功能进行识别后该如何应用和服务于科研工作者的科研需求的研究基本处于空白状态,这也正是本书的研究起点。
表9-1 学术文本词汇功能划分表
(www.xing528.com)
续表
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。