首页 理论教育 语料库定量与定性研究成果的实用指南

语料库定量与定性研究成果的实用指南

时间:2023-08-05 理论教育 版权反馈
【摘要】:然而,基于语料库的学术语篇研究也受到了一些批评。因此,基于语料库的定量观察有必要与基于直觉和内省的定性分析结合与互补。接下来,笔者将集中关注学术英语领域学者建议的定性研究方法,讨论基于语料库的定量与定性研究路径。

语料库定量与定性研究成果的实用指南

通过以上各个章节和相关文献,我们看到语料库在学术英语研究中发挥着重要的作用。一方面,语料库在丰富的语言事实基础上呈现学术语言的本体特征,包括词汇、短语和句式结构;另一方面,语料库为学术英语教学提供教学依据和资源。这种双重目标充分体现语料库在学术英语乃至更广泛的语言研究中的价值。正如Rundell(1996:4)所言,“大规模真实语料已从语言研究的边缘位置转移到了中心地位,并成为语言研究的基本资源”。语料库是第三人视角的观察数据,通过收集语言实例样本,描写真实学术语篇中使用者的语言选择和分布规律。De Beaugrande(2002)认为,语料库描写的深度(即语言描写的精度)和广度(即能够描写语言的素材数量)是基于语料库相关分析的两个重要问题,并依此进行定量和定性研究。

不言而喻,语料库揭示的最直接信息是语言使用频率和规律的定量数据,呈现语言选择重复性、规律性的一般特征。然而,基于语料库的学术语篇研究也受到了一些批评。一方面,语料库词语索引常常限制于自下而上、碎片化的词项分析,与学术英语惯用的体裁分析背道而驰(Swales 2002a)。体裁分析采用自上而下、基于过程的路径,通常以篇章宏观结构为出发点,关注主体单元而不是句子层面的词汇语法特征。另一方面,这也是语料库语言学经常面对的质疑,即对文本的语境意义关照不足。Widdowson(2000:7)提出,“语料库是意义实现的文本痕迹,无法解释话语建立过程中语言和语境之间的相互作用,生成的不是语言使用的人际互动描述……语料库解决的是文本证明,而非语境描写”。因此,Aston(1995)和Widdowson(2000)等称之为脱离语境的语言(decontexualized language),认为“语料库索引将语言实例剥离于每一个原始的交际情境,难以反映意义协商的语用含义”(Aston 1995)。Tribble(2002:134-135)指出“文本可以移动,但语境不能随文本而迁移”。Hunston(2002)也表示,索引行解读缺少社会文化语境的输入,这或许是语料库分析所面临的最严重问题。

因此,Widdowson(2000:7)表示,若要真实地充分反映语言使用的实际,则需要将索引和频率的文本发现进行语境重置(recontextualized)。正如Myers(1999)所言,不应该将互动本质的语篇“去物质化”(dematerialization),将其简单地视为可检索的一组语言特征,而是要把语篇“再物质化”(rematerialization),将参与者带回文本,试图还原真实语境下的话语交际。在Widdowson(2000)看来,语境重置的关键是重建第一人称认知(reality of first person awareness)。同样,Myers(1999)认为,重置语境也就是文本目的、功能和感知的再物质化。 正如我们在前面谈到的,语料库描述的是第三人称观察数据,无法呈现第一人称的内省认知。换句话说,语料库告诉我们人们写了什么,但是不能告知人们知道什么以及写文字的时候在考虑什么。这就需要我们在进行基于语料库的学术英语研究时通过定性研究方法,将语料库定量数据结果再语境化。梁茂成(2010)认为这是理性主义经验主义相互融合的必然产物。

Labov(1971:478-479)很早就指出,有效的语言研究应该是汲取不同类型的数据和方法,因为不同的数据和方法具有不同的信息挖掘和贡献,相互结合与弥补的互证有助于增强研究结论的信度和说服力。因此,基于语料库的定量观察有必要与基于直觉和内省的定性分析结合与互补。定量信息帮助我们直观而广泛地认识语言问题,定性分析可以帮助我们更加深刻地认识语言问题。就语言研究的深度和广度而言,二者各有所长:定量分析从广度对语言多方面加以描写,定性分析从深度阐释产生语言选择和规律的原因;定量研究通过大量的数据报告语言使用的规律,而定性研究则对定量方法所揭示的语言规律和趋势作深度解读,两种研究方法相辅相成。接下来,笔者将集中关注学术英语领域学者建议的定性研究方法(Bhatia 2004;Flowerdew 2013b;Hyland 2016a),讨论基于语料库的定量与定性研究路径。

Hyland(2016a)列举了学术英语常用的定性研究方法,包括类属诱导法的访谈、焦点小组以及类属内省法的有声思维、日志。Flowerdew(2013b)则以第一人称认知视角将上述方法按目的、用途重新归类。当然,我们也可以通过量化的调查问卷了解目标对象的态度与认知,用以补充语料库分析结果。例如,胡春雨(2012)通过调查多个学习者口笔语语料库和16名受试者产出的口笔语语料,考察了中国英语学习者义务型情态词的使用特征,并结合问卷、访谈等方法探讨了其产出的原因。语料库定量结果表明,中国高水平英语学习者在七个情态词的使用上与本族语者相比存在严重的偏离;不同水平组的学习者在义务型情态词的使用上大体接近,但高水平英语学习者表现出很强的少用must的倾向;上述情态词的使用存在一定的个体差异。通过问卷和访谈的调查发现,义务型情态词自身的特性以及情态教学的失误是出现上述现象的外因,而汉语情态系统的迁移、学习者的二语水平、对输入进行加工的普遍原则及变异则是出现上述现象的内因。

Bhatia(2004)建议从语句文本、社会认知、人际互动和社会文化四个层面全面解析语篇特征,并提出多层面–多维度的语篇分析框架(如图4.8)。该框架的理论结构是,语料库在语句文本层面提供重要的定量信息,定性研究方法旨在挖掘社会认知、人际互动和社会文化层面的信息知识,在相互作用下协助阐释第一个层面的语料库定量数据。该框架不仅清晰地归位了定性研究方法的信息功能,而且描述了定性方法与定量发现的关系。(www.xing528.com)

alt

图4.8 多层面–多维度的语篇分析框架(Bhatia 2004:189)

在上述诸多定性方法中,访谈是学术语篇分析中运用较广的方法。研究通常采取“基于语篇的访谈”来调查语篇作者的语言选择和策略运用的隐性知识和实践认知(如Hyland 2005c;Jiang & Ma 2018a)。Lancaster(2016)提倡运用基于语料库的文本分析来确定访谈的内容,这有助于研究者不会错失直觉难以捕捉但有研究意义和考察价值的语言选择。他考察了一名哲学专业高年级本科生的写作文本,语料库频率数据表明该学生在课程论文中反复使用了认知立场标记语,且该立场标记符合哲学论辩的规则与效用,但是在访谈中,该学生与其导师都没有意识到该立场标记的频率与规律。可见,语料库能够帮助我们有效地识别难以发现的语言选择以及隐匿的使用规律。不可否认的是,我们在通过质性研究挖掘语言选择和使用的第一人称意识时,关键的一步是要找到细微的修辞策略和语言特征。语料库分析提供语言所使用的“归纳统计的数据”,帮助组织访谈的提示和问题,特别是基于语篇的访谈,增强“言语数据回溯描述”的客观性(Lancaster 2016:143)。

在最近的一项学术语篇研究中,Jiang & Ma(2018b)通过基于语料库的定量与定性方法考察了教育学博士研究生在开题报告中“读者带入”(Hyland 2005c;Hyland & Jiang 2016)的使用特征,旨在探究博士生运用读者带入互动特征的写作表现与主体认知。他们自建了包含十篇博士开题报告的约30万词符小型语料库,然后检索读者带入的语言特征。语料库分析数据表明,相比于教育学期刊论文,博士研究生少用指令语、知识诉求、修辞问题和插入语,而多用读者指称。在读者指称类别中,博士生使用we、our和us的频率远远高于you。以上述各类读者指称作为访谈提示时,一位博士生说道,“我认为评委应该不喜欢我使用you,因为听上去有些失礼”;另外一位博士生说道,“我比较谨慎使用you,因为比较口语化”;还有博士生表示,“我尽量不用you,用它好像中学生在和老师谈话”。另外一个有意思的发现是,当诉求共享知识时,博士生多选择逻辑推理的共享带入,少用研究条件和学术传统方面的带入手段。在根据该类共享知识的语言特征进行的“基于语篇的访谈”中,博士生表示,“我是教育学领域的一个新手,所懂内容还很不足,所以依赖学术传统和研究条件是有风险的”。通过以上几例语料库定量结果与定性考证的补充信息,我们看到基于语料库的定性方法可以帮助揭示语言运用第一人称的认知和理解,对语料库的定量数据给予语境重置,让我们更全面地了解语言选择和使用的表现和认知。

另外一个比较有代表性的与语料库结合的质性研究是Dressen-Hammouda跟踪地质学学者立场标记和身份建构发展变化的系列研究DressenHammouda(2014a,2014b)。首先,Dressen-Hammouda(2014a)建立了野外地质学学科领域于1992年至2003年发表的140篇权威期刊论文语料库,并基于此语料库发掘了13个影响该行业学术文本建构的语言指标,将其归为人际类资源(如第一人称和评价形容词等)、实践类资源(如研究行为动词、方位副词等)和专业类资源(如地质年代描述、文献引用等),并列出各语言指标在语料库中出现的频率。为了获悉与行业相关语言指标的有效性和理据性,她回顾了地质学野外考察的历史史料,实地观察了野外地质研究者的实践操作,访谈了地质研究者的主观认知和地质学科学者职业发展的自述并邀请学科从业人员识判语言指标。通过上述质性方法,Dressen-Hammouda考察了语言指标在语料库中出现的不同频率(2014a)。接下来,Dressen-Hammouda(2014b)自建了源于地球化学、岩石学和构造地质学三个学科发表于1983年至2009年的88篇实地报告(field account)的小型语料库,他跟踪了其中一位作者在获得博士学位时和十年后发表的期刊论文(2000年和2009年),在调查了上述语言指标的使用变化情况后,发现该作者在十年间论文中变化最大的是人际类资源和专业类资源的使用,其中人际类标记高出该篇语料库均值的标准差,而专业类资源在标准差范围之内。然而有意思的是,通过与该作者基于语篇的访谈,研究者发现该作者并没有察觉2000年和2009年的论文在专业类语言指标使用上的差别,但他意识到了丰富评价形容词的使用带来的人际类资源的变化。可见,基于语料库发现的质化调查有助于研究者更好、更全面地解读语料库的量化结果。

在本章中,我们看到语料库分析通过不同的语言特征揭示学术英语的各种语篇表象和特点。索引、搭配和词块是基本且最常见的语料库研究手段,它们展现了学术文本词语选择的语篇语境以及表达词语使用的交际功能。然而,为了更具体地展示学术语境和体裁要旨,学术英语研究中使用的语料库趋向学科导向性强的小型语料库。语料库有助于我们观察语篇作者潜意识语言选择显示出来的学科话语规律和语境关联。语境问题一直是语料库研究面临的争议之一。尤其是基于语料库的学术语篇研究,被认为缺少第一人称主体视角。基于此,本章还对语境重置的方法进行了讨论,论述学术英语通过多方法、宽路径的基于语料库定量和定性的方法挖掘学术语言使用的频率和影响因素。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈