既然阅读教学的总结性评价通常表现为阅读测试,那么评价的关键就在于试卷的有效性。就此,下面来谈谈如何在阅读测试方面进行有效的试卷设计。
(一)明确测试性质
阅读测试从考试学的角度可以分为阶段性或者单元测试、水平考试(会考)以及升学考试(中考)。从语言学的角度则主要体现为下述四种测试类型:
1.学业水平考试
学业水平考试是鉴定普通中学生相关科目学习质量的水平考试,是考核普通中学生相关科目学习是否达到课程标准要求的主要手段。它不同于具有选拔性质的高校招生考试,也不同于为学分认定而设置的模块考试。
2.学能测试
学能测试不仅能让学生及时了解自己各学科的真实水平,更是让家长、教师深入了解学生学习潜力的重要手段。它主要评估学生在不同情况下的表现或反应,与其他群体进行比较是其主要方式,如披萨考试(阅读+数学+逻辑)就是典型的学(潜)能测试。
3.水平测试
英语能力考试,针对母语非英语的学生。比较有名的英语能力考试之一是夏威夷大学希罗分校组织的。该考试是进入以英语为第二语言课程的必要条件,而以英语为第二语言课程能使学生做好完成大学教育的充分准备。根据考试结果,学生将被分配至夏威夷大学希罗分校英语中心所开的一门或几门课程。
4.诊断性测试
诊断性测试主要用以探测英语学习者在理解和表达上的障碍,尤其是障碍的成因,为教师有针对性地调整教学方案、选择更适合的教学手段提供依据。诊断性测试一般需要根据所诊断的问题专门设计内容,不同的诊断目的需要采取不同的测试形式。因此,诊断性测试的形式和内容常常会因不同的对象和目的发生变化,如月考。
教师需要根据上述这些不同的测试性质,进行体现不同测试目标的试卷设计。
(二)注意试卷的信度和效度
1.信度(www.xing528.com)
试卷的信度主要是指测验结果的可靠性、一致性和稳定性,即测验结果是否反映了被测者稳定的、一贯性的真实特征。信度受随机误差的影响,随机误差越大,信度越低。
信度可分为“外在信度”和“内在信度”两种:外在信度是通过比较所累计的检测结果来验证信度,由相同或类似的试题多次采集数据;内在信度则是在同一套试卷内测验不同试题之间的一致性。
信度计算的方式有“再测信度”“复本信度”和“折半信度”三种:再测信度是用同一测验工具(同样试题)在相同或类似条件下对相同受试者进行时隔两周的两次测试,分析两次测试结果,得出相关系数(采用皮尔逊积差相关的两组测试计算方法);复本信度是用两个不同的测验工具测验两组类似的受试者(同样人群做两套试卷),比较两组的测验结果,若能保持一致则说明测验工具的信度好,在此过程中同样采用了皮尔逊积差相关的两组测试计算方法,需注意控制难度和区分度的统一;折半信度是根据单双号将测验结果分为两组,再计算两部分的相关系数,需注意的是这种测试仅使用一次,并且仅在一个群体上,测试被划分为几个部分,一半的分数与另外一半相关,协同因素被史布信度调节。
可能会对信度产生不利影响的方面有:波动,包括学习者的波动、分数的波动、命题管理的波动(如规则、灯光等客观环境);试卷特点,包括试卷的长度、难度、范围,以及辨识力(中等难度区分度最好)、速度和同质问题等;反应特质,包括回应上的武断性以及依靠聪明和熟悉所做的回应等。
2.效度
效度即有效性,是指测验工具能够准确测出事物的程度。测验结果与所考查内容越吻合,效度越高;反之,则效度越低。
效度可分为内部效度、外部效度和理论效度三种:
(1)内部效度是反映自变量与因变量之间因果关系明确程度的一种指标。如果一项研究得到的结果有且只有一种解释,那么该研究的内部效度就高;如果结果有且不止一种解释,那么该研究的内部效度就低。内部效度所研究的是试卷本身,并可以进一步细分为非专家意见的“表面效度”、反映内容之间相关性和覆盖率的“内容效度”以及关于被测试者行为与思想的“答题效度”。
(2)外部效度,研究结果和变量条件、时间和背景的代表性和普适性,如实验结果应用到其他人群或环境的程度。外部效度又可以进一步细分为“总体效度”和“生态效度”两类。
(3)理论效度,又称“结构效度”或“构想效度”,是指一个测验实际测到所要测验的理论结构和特质的程度,或者说,测验分数能够说明心理学范畴中某种结构或特质的程度,是检测实验与理论之间的一致性,即实验能否真正测验到所构造的理论。
3.信度与效度的关系
首先,信度是效度的前提条件,一次测试只有有了信度才有效度,但是有信度的测试未必有效度;其次,命题是一个协调的过程,是在信度和效度之间不断协调的过程,信度与效度也未必总能清晰分割。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。