学术文本的词汇语义功能从语义层面对词汇进行认知与理解,指的是词汇在学术文本上下文环境中所对应的内容或用途。其不同于自然语言处理领域的语义角色,语义角色包含核心语义角色(如施事、受事等)和附属语义角色(如时间、地点、方式、原因等)[143],而学术文本的词汇语义功能一般可以分为研究主题、研究方法、理论模型、指标等。
国内外学者针对学术文本的词汇语义功能已经开展了一定的研究。不同的学者依据不同的研究目的,产生了不同的词汇语义功能分类框架。文献[8]对文献的标题进行分析,将标题中的词汇语义功能分为研究主题、研究方法、研究目的和其他四类。在此研究基础之上,文献[9]又将标题以及摘要中的词汇语义功能分为技术和效果两类,其中技术包含研究中使用的算法、工具、材料以及数据,效果由属性以及属性值组成。随后,文献[10]将摘要中的词汇语义功能分为话题、技术和领域,话题指的是该文章的主要贡献,技术包含采用的方法和工具,领域指的是文章的应用领域。文献[144]将词汇语义功能分为过程、任务和原材料,过程包含研究采用的方法和设备,任务指的是研究的问题或主题,原材料则包含语料库和物理材料。文献[11]将词汇语义功能分为技术与应用,例如“We apply support vector machines on text classication”中,“support vector machines”代表技术,“text classication”代表应用。文献[145]将计算语言学领域学术文本词汇语义功能分为领域和技术,其中的领域有机器翻译、信息抽取、自动问答等。文献[146]将学术文本中的词汇语义功能分为技术、应用、评价指标以及数据集四类。文献[147]将与数据处理相关的学术文本的词汇语义功能分为数据集、方法、软件、目标和结果5类。文献[148]把科学研究看成提出问题以及解决问题的过程,将词汇语义功能分为研究问题和研究方法。文献[134]基于学术文本词汇功能显现机理,构建了一个领域无关词汇功能和领域相关词汇功能相结合的学术文本词汇功能框架,其中领域无关词汇功能框架主要包含方法和问题两个维度,领域相关词汇功能框架中就计算机学科、数学学科和社会科学学科三个领域的学术文本词汇功能进行简单的列举。文献[136-137,149]先采用人工对情报学报发表的论文中的理论和方法进行标注,以研究我国情报学领域理论和方法的应用情况,随后将学术论文中的理论术语看成一种特定类型的命名实体,分别使用条件随机场和深度学习模型对学术论文标题和摘要中的理论术语进行识别[150-151]。(www.xing528.com)
可见,不同学者针对学术文本不同的部分如标题、摘要等制定了不同的词汇功能分类框架,却较少涉及学术文本关键词。为此,笔者拟借鉴上述词汇语义功能分类框架,构建信息计量学领域学术文本关键词语义功能分类框架,为关键词语义功能的相关研究奠定基础。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。