首页 理论教育 学术英语词汇表覆盖问题的研究成果

学术英语词汇表覆盖问题的研究成果

时间:2023-08-05 理论教育 版权反馈
【摘要】:尽管Coxhead和Gardner & Davies的研究已经充分体现了语料库在提取多体裁文本显著词汇方面的价值,但是国内外学者仍然在试论学术英语词汇表在学科和体裁方面的覆盖率问题。例如,Lei & Liu转向医学领域,以Coxhead和Gardner & Davies为比较对象,总结出含有819个词族的医学英语通用词汇表。覆盖率标准是在四个领域都出现且在24个学科中超过一半的范围出现,频率设定为至少每百万词出现26.9次,要求词族出现在24个学科的离散度为0.6。

学术英语词汇表覆盖问题的研究成果

词汇是语料库研究最直接的目标对象(Flowerdew 2015a)。然而就学术英语而言,基于语料库的词汇研究主要涉及三个方面:学术词汇的学科或体裁覆盖率、词汇的功能应用以及词块的形式与功能。

第一,学术词汇的学科或体裁覆盖率。

Coxhead(2000)基于350万词符的书面学术英语语料库,以幅度和频率为参数,提取涵盖57个词族的学术英语通用词汇表。然而,Gardner & Davies(2014)质疑了Coxhead(2000)以词族为单位判断词汇频率的做法,并以美国当代英语语料库(COCA)的学术文本为语料,提出了新一代的学术英语词汇表。尽管Coxhead(2000)和Gardner & Davies(2014)的研究已经充分体现了语料库在提取多体裁文本显著词汇方面的价值,但是国内外学者仍然在试论学术英语词汇表在学科和体裁方面的覆盖率问题。

Hyland & Tse(2007)针对Coxhead(2000)的学术通用词汇表,考察其在超300万词符的多学科、多体裁学术英语语料库的覆盖范围和频率。结果表明,尽管通用词汇表整体覆盖学术语料库的10.6%,但是每个词汇却通常以不同的覆盖率、频率、搭配和词义出现在不同的学科里。Valipouri & Nassaji(2013)基于自建的400万词符化学期刊论文语料库,对化学学科的常用词汇进行了深入的观察,得出约1,400个词族的化学常用词汇表。对比Coxhead(2000)的570个词族,他们发现其中仅有327个词族出现在化学英语语料库中,覆盖率不及10%。此研究结果再一次激发学者挖掘其他学科的通用词汇覆盖率。例如,Lei & Liu(2016)转向医学领域,以Coxhead(2000)和Gardner & Davies(2014)为比较对象,总结出含有819个词族的医学英语通用词汇表。其中名词最多,包含444个词族;动词有133个词族;形容词有219个词族;副词最少,仅有23个词族。

为了弥补学术英语口语词汇特征研究的不足,同时帮助二语学习者提高理解英文学术演讲的能力,Dang et al.(2017)建立了1,300万词的学术口语语料库。语料既包含已建的学术口语语料库,如英国学术口语语料库、密歇根学术英语口语语料库,也包含耶鲁大学、麻省理工学院等高校开放课程多媒体资源以及自建的课堂录音语料。为了尽可能地涉猎不同专业学生在学业学习中遇到的口语活动,Dang et al.(2017)的编集分属“偏理论的硬学科”(hard-pure)、“偏应用的硬学科”(hard-applied)、“偏理论的软学科”(soft-pure)和“偏应用的软学科”(soft-applied)四个领域的24个学科,并囊括课堂教学、研讨会、实验室讨论以及课业辅导四种交际类型。覆盖率标准是在四个领域都出现且在24个学科中超过一半的范围出现,频率设定为至少每百万词出现26.9次,要求词族出现在24个学科的离散度为0.6。研究发现了1,741个满足条件的词族。这些词族分为四个层级,前两个层级是满足词表条件的通用高频词(如alright、know、stuff),后两个层级表示学术口语语料库中高频出现但非通用高频的词汇(如achieve、significant、aspect、review)。

第二,词汇的功能应用。

如前所述,学术英语研究参照系统功能语言学探讨语言特征的概念、人际与篇章功能。就词汇而言,亦是如此。Holmes & Nesi(2009)基于英国学术笔语语料库,分析了学术英语122 个高频动词涉及的概念信息过程,例如历史学科常用suggest表达言语过程(verbal process),物理学科则用show构建这一过程。而从人际意义考虑,陈建林(2011)认为这两例动词体现作者在揣测读者可能的观点后使用的模糊语和语气加强词,分别用以扩展和锁闭对话话语空间。同样,Flowerdew & Forest(2015)发展了名词资源的概念功能,进而系统讨论了名词的篇章功能,姜峰(2015a,2016)全面考察了名词的人际立场功能。可见,国内外研究主要围绕语言的概念、人际和篇章意义讨论词汇在学术英语中的功能应用。上一节已经充分讨论三个元功能在学术英语中的语料库研究,故而这里不再赘述。(www.xing528.com)

第三,词块的形式与功能。

词块是学术语篇中反复出现的多词序列(Biber et al. 1999:990)。尽管词块的语料库方法方面超越其原有的“程序化”属性,在形式上更强调序列自然反复的共现,在统计上更强调发生频率及分布范围(Hyland 2012b)。因此,在学术英语研究中,词块被定义为“在特定的频率及分布标准下采用语料库方法检索提取的连续多词序列”(Chen & Baker 2010:30)。在操作上,最常见的是词块被设定为4词词块(Cortes 2004;王芙蓉、王宏俐 2015)。这些研究认为很多4词词块在结构上包含了3词词块,又比5词词块的使用频率高出十倍(Cortes 2004:401)。发生频率常被设定为每百万词出现20或40次,分布范围至少为语料库所有文本的10% 。在功能分类上,Biber将词块在语篇中的功能视为“立场标记”(stance expression)、“篇章组织”(discourse organizer)和“指示功能”(referential expression)(Biber 2006b;Biber et al. 2004;Biber et al. 1999),而Hyland更倾向于将词块与学术语篇所表达的学术活动结合起来,认为它们分别体现“研究活动”(research-oriented activity)、“人际过程”(participant-oriented process)和“篇章过程”(text-oriented process)(Hyland 2008a,2008b,2012b)。尽管国内外开展了大量的词块研究,但是主要集中在各类对比研究,如对比不同体裁、不同学科以及对比学习者与资深作者、英语为母语与非母语者的词块使用情况。

首先,在体裁方面,Biber et al.(2004)对比了学术语境下的口笔语语域,发现课堂教学体裁出现的词块结构最多,其次是教材和期刊论文。在词性方面,与名词相关的词块最为频繁,在上述三个学术体裁中呈现类似的分布。此外,课堂教学体裁还使用大量的动词词块,但教材和期刊论文中却很少出现动词词块。Biber(2006b)进一步细化了学术体裁在词块使用方面的研究,结果显示课程设置类体裁(如教学大纲)中词块出现频率最高,其次是课堂组织和各类校规文本。同时,他还发现尽管教材中词块频率较低,但所使用的词块绝大多数都属于指示类。陈海员、陈香兰(2012)深入讨论了教材中词块的分布和使用特点,发现大学通用英语教材内动词类词块最多,名词类次之,而ESP类教材中名词类词块多于动词类词块。此外,虽然语法构成方面存在上述差异,但是指示词块在两种教材中都是最多的,篇章组织类词块的数量次之,立场词块最少,因此陈海员、陈香兰(2012:72)认为这反映了“指示词块是教材词块的主要构成”。

学科间性比较也是词块研究的一个重要方向。Hyland(2008b)以自建的300万词符,涵盖电子工程学、生物学、经济学和应用语言学期刊论文和学位论文的学术文本为语料,考察4词词块在学科间的分布和使用情况,发现电子工程学文本所含词块最多,经济学和应用语言学次之,生物学最少。整体而言,“名词+of”词块频率最高,但是电子工程学和生物学更倾向使用“被动+介词短语”词块。学科差异也体现在词块的功能上:电子工程学和生物学运用最多的是与研究活动相关的词块,而经济学和应用语言学更依赖篇章过程类词块。Hyland(2008b:20)认为,不同的学科会选取不同的词块结构在不同的知识建构体系下发展语篇论辩,建立观点的言据信度,进而增强劝谏规约效果。词块择取和学科话语实践的相关性在王芙蓉、王宏俐(2015)的研究中得到进一步证实。她们选取高影响因子的SSCI语言学期刊论文和SCI工科论文作为语料进行研究,发现两类学科学者使用的词块结构形式相似,但两个学科论文中的介词和动词词块使用比例存在差异,指示性词块在两个学科论文中的使用比例较高,从而认为词块的结构、 功能与学科研究方法、语境、写作体裁等密切相关。

最后,国内外学者更集中地分析不同人群在使用词块上的异同,认为“词块是学术语篇中高频出现的复现序列,区别于完全固化的习语表达,在日常使用中对于本族语者和非本族语者都具有心理真实性。加工提取便利,能够协助学术作者思考与写作。然而,学术词块被看作是专属于专家作者而非学术新手的语言资源”(周惠、刘永兵 2015c:35)。Cortes(2004)和Hyland(2008a)对比了学习者与资深作者文本中词块的形式和功能方面的差异,李梦骁、刘永兵(2016)和潘璠(2016)将研究对象定位为中国学者,Chen & Baker(2010)和周惠、刘永兵(2015c)则在更加广义的层面对比以英语为母语和非母语学习者使用词块的异同。以期刊论文为代表的资深作者文本内典型的词块在学习者文本中均存在缺位现象,如历史学科文本中篇章类词块和生物学中指示计量类词块(Cortes 2004)。而在李梦骁、刘永兵(2016)的研究中,中国学者使用的目标词块在数量和种类上均超过本族语者,但是在与研究活动相关和人际过程方面的词块使用欠缺。可见,中国学者在利用词块报告学术观点,建构语篇方面重视文本衔接性的同时却忽视“语篇的互动性和表述的严谨性”(李梦骁、刘永兵2016:514)。学习者和中国学者在词块使用方面的不足也恰恰反映了英语非母语的作者使用词块的普遍特点,即总量上接近母语作者,但种类和语用功能方面存在显著的欠缺(如Chen & Baker 2010)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈