语料库的建设常常涉及诸多问题,如采集文本,取样和整理,考虑语料的代表性和均衡性,标注元信息等(Sinclair 2005;梁茂成等 2010)。对于学术英语语料库的建设而言,语料的代表性、均衡性以及元信息标注显得尤为突出。学术英语语料库研究讲求文本语境的专门性和具体性,比如文本所属学科越具体越好,文本体裁越明确越好,因此所建学术英语语料库需要能够充分代表聚焦的文本体裁,包含均衡的作者组成。
Leech(1991)认为,语料是否具有代表性涉及研究结果能否普及到所关注的语言或语境的整体。McEnery et al.(2006)认为,语料的代表性主要体现在文本的体裁范围和选取标准上。如果研究目标是学术英语的语言特征,那么语料在口笔语的体裁范围和构成上都需要均衡。就笔语语料而言,语料库不仅要包含研究论文、实验报告,还要包括教材、书评和学位论文等。如果研究者关注的是历史学期刊论文的语言特征,那么在建设语料库时需要考虑:是仅搜集研究论文,还是要包含书评和综述类文本。可见,语料的体裁范围取决于研究目的。此外,在建立期刊论文语料库时,我们还要全面地斟酌文本的选取标准。通常,一方面我们根据学科内期刊影响因子排名,如根据ISI Web of Knowledge发布的期刊影响因子参数,选定每个学科的期刊;另一方面,我们仍需要咨询学科专家,对排名上榜的期刊进行评价并给予推荐建议。经由以上两步确认的期刊名单应该才是权威的、有说服力的。(www.xing528.com)
学术文本的作者构成往往比较复杂。比如,期刊论文既有独立作者的文章,又包含多人作者的合作文章;既有本族语者的文章,又有非本族语者的文章。由于作者构成复杂,在语料库建设时,研究者需要思考如何准确地定位一种期刊。比如,对比中外学术期刊语言特征的研究经常将Chinese Journal of Applied Linguistics界定为国内刊物,但是该刊物采用的是国际同行评审,而且发表大量国际学者的学术论文。因此,在建设学术英语语料库时,我们不可忽视文本的作者构成。如果研究目标是学术论文中自称语的使用,那么作者构成要保持均衡,或者全部是独立作者,或者全部是多人作者,或者各占一半。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。