(一) 学习评价的一般过程
在教育评价领域,尽管存在着各种各样的评价模式,它们的实施方式与操作程序不尽相同,但是,一般都可以划分为三个阶段,即准备阶段、实施阶段、结果分析处理阶段。
1.学习评价的准备阶段
准备阶段是教育评价具体实施前的预备阶段。它对评价程序来说,是必不可少的一个步骤,是成功地开展教育评价的前提和基础,准备工作的好坏将直接影响评价的质量,影响评价功能的发挥。准备阶段的核心工作是要制订明确、具体的评价方案。
评价方案一般分为长期、中期和短期三种,所谓长期评价方案,就是指教师对一学年或者一学期内即将进行的评价的构想;中期评价方案一般指对一个单元内即将进行的评价的规划;而短期评价方案常常是指教师就某一次评价所提前进行的规划。评价方案的类型不同,其重点描述的详细程度也各不相同。不过,一个周密完善、切实可行的评价方案,既包括评价的目的、评价涉及的内容,又包括学生表现的途径以及具体实施程序等。具体来说,至少需要以下六个步骤。
步骤一是明确评价目的。明确评价的目的,是任何一项评价方案设计首要考虑的事项,只有目的明确,教师才可能去选择相应的评价方式。对于数学学习评价来讲,其终极目的就是要全面了解学生的数学学习状况,以促进教学的改善。不过,教师还需要就教学过程中的特定问题与不同阶段,来确定评价的具体用途,如诊断、安置、准备、形成等。例如,教师在教学开始之前进行评价,通常可以有两方面的目的,即确定学生是否具备学习新内容所必需的知识与技能;或者是要检查学生是否对将要学习的内容已经有所掌握。针对这两种不同的情况,教师采取的评价方法通常是不相同的。
步骤二是确定评价内容。确定评价内容是评价方案设计的核心部分。课程标准已经从行为与内容两个方面明确规定了数学学习的终极目标,但是教师在一次评价活动中不可能,也没有必要全面地、毫无遗漏地评价所有的方面。因此,在教学实施的不同阶段或者针对不同的教学单元,教师就要进一步选择与确定具体的评价内容。教师在明确评价内容时至少要把握两点:一是所选择的评价内容必须与课程标准规定的课程目标相一致;二是要注意内容的全面性,能够考虑到所有的目标领域。
步骤三是确定学生表现的展现途径。针对不同类型的目标,需要学生展现自己所知、所做的方式和角度都有可能不尽相同,那么,教师就需要事先准备,以便在评价中能够准确把握和记录学生的种种表现。从大的方面来讲,在数学学习评价中,学生表现的途径大致可分为书面的、口头的与活动的三种形式。书面的表现途径主要有传统的纸笔测验、做书面数学作业、记数学笔记或日记,以及各种对过去经历与当前理解的个人记录等;口头的表现途径主要包括课堂问答、小组讨论、口试以及其他的口头汇报等;活动形式的途径则是指学生从事的各种数学学习活动,如课堂探究、问题解决、合作与交流等。
步骤四是选择并设计适合学生表现的评价任务与标准。明确了目的、内容以及学生可能的表现方式之后,教师就需要正式编制引发学生表现的各种具体评价任务,如编制一份试卷;设计一系列课堂提问的问题;安排一次课堂讨论;提出一项数学问题解决任务等。与评价任务设计相关的还有相应的评价标准,即如何给分,如何评定等级等。评价标准的建立一方面需要与课程标准相一致,另一方面需要学生参与确立标准,因为只有学生明确了标准,才能够理解评价,才能够进行自我反思。
步骤五是明确评价实施的有关事项。有关评价实施的事项主要包括明确实施评价的时间与地点;评价参与者以及信息搜集方式。评价目的与内容不同,评价的时机与地点也往往不同。例如,评价学生的独立思考能力,可以选择在学生自发的学习活动过程中评价学生的合作能力,可以选择在集体的学习项目进行过程中;评价学生的学习积极性,可以选择在课堂教学进程中;评价学生的学习准备情况,就需要选在教学开始之前进行;评价学生对某一单元的掌握情况,则需要在单元学习结束之后进行。
而在不同时机与地点下的评价,评价的参与者以及信息搜集的渠道也会有所差别。例如,在课堂教学过程中的评价,学生、其他任课教师以及评价专家都可以成为评价的参与者,而家长的参与就比较困难,而如果利用家庭作业进行评价,家长的参与则很有必要。同样,针对不同的评价任务,如有的需要学生独立完成,有的需要学生集体合作,有的则需要学生借助于其他信息渠道完成,搜集信息的渠道与方式也需要精心考虑。
步骤六是明确如何处理与运用评价结果。在评价的最后阶段,如何分析和处理搜集到的评价信息?在成绩的判定与记载中应该强调什么?评价过程及其结果应该向谁报告,报告些什么,报告应采取何种形式?这些问题的考虑是至关重要的一个步骤,将直接关系到数学学习评价发展性功能的实现。
不过,建立评价方案的目的是使教师对即将进行的评价做到心中有数,师生能够对即将进入的单元以及评价标准达成共识,但是,教师要避免将评价方案设计成一个死板的评价规划,然后按部就班、丝毫不改地执行。
2.学习评价的实施
学习评价的实施是指实际进行评价活动的阶段,它是整个评价程序的中心环节。学习评价的实施阶段大致包括三方面的工作,即搜集评价信息、整理评价信息、做出价值判断。
(1)搜集评价信息
搜集评价信息是进行评价工作的基础性工作。评价信息是进行评价的客观依据,是做出科学结论的必要条件,对评价的有关信息占有得越多,得出的评价结论就可能越准确合理。所以,在实施阶段,要根据评价目标广泛搜集评价信息。具体来讲,就是要注意以下三个方面的要求。
一是要注意评价信息的全面性,即评价信息要全面反映评价对象的全貌和全过程,不能有某一环节的疏漏。二是要保证评价信息的准确性。在搜集信息时,应根据评价目标,搜集那些最准确、最能反映评价对象实际的信息。三是要取得足够的信息量。信息的准确性,反映的是信息的质。从质和量的关系看,质是以一定的量为必要的条件,没有一定的量就没有一定的质。但是,并不是说信息越多越好,而是要求所获取的信息量,应足以保证对评价对象的质量做出准确客观的价值判断。
搜集评价信息的方法主要有测验法、观察法、谈话法和问卷法。其中,测验法是数学学习评价的主要方法。因此,如何设计测验,提高测验质量就显得非常关键。对此,笔者将在数学学习评价策略构建部分详细探讨。
(2)整理评价信息
整理评价信息主要是指将搜集到的全部信息,加以反复核实,对评价信息的全面性、准确性、适应性以及搜集评价信息方法的可靠性,进行认真检查、分析和整理。信息整理的过程又可以分为三个步骤,一是归类,就是将所有评价信息按照一定的标准进行初步分类。二是审核,即根据既定的评价目标,对全部评价信息,逐一核实,进行去伪存真、去粗取精的鉴别和筛选。对缺乏的信息,要及时补充,对次要的、代表性差的信息要舍弃;对需要运用统计手段加工的信息,及时进行数学处理,使评价信息具有完整性、真实性、准确性。三是建档,就是将审核后的评价信息,根据评价目标,分门别类地制成一定的表格形式或卡片形式,并进行编号建档,为评价做好准备。
(3)做出价值判断
这是评价实施阶段的最后一项工作。这项工作要求评价者根据汇总的评价结果,对评价对象做出准确的、客观的、定量或定性的评价结论,形成评价意见,必要时,可对评价对象做出优良程度的区分,或做出是否达到应有标准的结论。
3.学习评价的结果分析和处理(www.xing528.com)
学习评价过程的最后一个阶段,就是对评价结果进行分析处理。这一阶段的工作质量直接关系到评价功能的发挥,关系到评价目的能否实现。在这个阶段中,主要包括以下三项工作。
(1)检验评价结果
一方面,要检查评价程序的每个步骤,看其是否正确、全面地贯彻了评价的基本原则,是否真正理解和把握了评价目标和标准,从而确认评价结果的正确性;另一方面,针对量化的评价结果,可以运用教育统计学的检验方法,对评价结果的统计量进行检验。
(2)提供改进建议
要想真正发挥评价的功能,评价活动结果的信息必须向有关人员进行反馈,并根据评价提供的情况,做出改进教学的措施。
(3)总结评价工作
学习评价本身也是学习的一部分。无论教师还是学生,都要对学习评价活动进行总结,并要建立学习评价资料档案,以备为今后的教学或学习提供查阅和研究之用。
以上结合教育评价的一般程序,对学习评价的过程进行了分析。在具体的评价活动中,三个阶段不是彼此孤立的,前者影响和决定后者的质量,后者又可以为前者的改进提供信息和依据,它们是一个统一的整体活动过程。
(二) 学习评价的方法
学习评价方法是对学习评价的发展变化最为敏感的因素之一,在一定程度上,方法的革命性变革会直接导致学习评价质的变化和跳跃式发展。从学习评价的历史发展来看,学习评价方法经历了由经验性到科学化、由单一化到多样化的发展,而且在不同的时期表现出不同的特点。
1.早期的传统考试
考试是最早的正规评价方式。考试的形式有两种,即口试和笔试。在学校教育尚未普及时,学校考试主要是口试,即教师向每个学生提出不同的问题,要求学生口头作答,以判定学生的知识掌握程度。随着教育的逐渐普及,以及在校学生的不断增多,口试开始受到来自各方面的越来越多的指责。尤其是学制产生之后,随着班级授课制的实施,教育领域开始注重教育的效率。学习评价不仅仅作为教学过程中学生成绩的评价、教学信息反馈的手段,而且与学制相结合,成为学制中学生学籍管理和学校管理的手段。口试的诸多缺点也逐一暴露,具体表现在以下三个方面:第一,口试法不能向各个学生提出同样的问题,难以根据统一标准进行比较;第二,随着教育的发展,学生渐多,口试法要从多方面考查学生,在时间上不经济;第三,口试的结果容易受到主考和学生当时的主观状态左右。
于是,费时费力的口试慢慢退至评价的边缘,代之以统一的笔试。笔试出现并代替口试是一个较为漫长的过程。虽然在我国隋朝时期,就已经产生了比较正规的笔试,但是那时的笔试仅限于当权者选择自己所需要的官吏时使用,并没有成为学校评价自己学生的一种主要方式。西方真正意义上的笔试产生于1702年英国的剑桥大学。1747年—1750年间,剑桥大学用笔试进行了数学荣誉学位测试。牛津大学的笔试始于1800年,牛津大学颁布了学生考试章程,以指导和管理学生评价活动。19世纪中期,牛津大学委员会宣称“考试这种评价的主要方式已经成为主要工具,它不仅用来测验学生的熟练程度,也用来刺激和指导学生的学习”。1845年,美国麻省波士顿市教育委员会首次用笔试大规模地考查该市所属学校的学生,后来在美国逐渐推广和发展起来。到19世纪末,笔试已经在学生的学习评价方式中占据了绝对主导位置。
笔试可以在较短的时间内对众多的学生进行统一的评价,能够满足近代扩大教育机会的要求。它主要具有四个优点,一是经济易行。无论是教育系统内的选拔性评价、学年终结性评价,还是学校内部的学期测验、单元考试,笔试都可以在同一时限内以团体形式对所有学生同时考试,效率相对较高。二是内容深广。一张综合使用多种题型而又拼配合理的试卷,其试题可达数十题甚至上百题以上,又能顾及主试者的意图,有利于多方面、多层次地测试学生的知识和能力。三是质量易控。所有学生使用的是同一份试卷,应试程序和规则相同,应试环境大体一致,有统一的评分标准,能较好地保证测试的质量。四是比较客观公正。学生笔试的记录较易保存,便于分析。对特定的学生,教师进行偏袒或歪曲的可能性较小。
尽管笔试的客观性、可靠性比口试高,并节约时间,测试效果也大大优于口试,但此时的笔试不外是一种论文体考试,评分时常被主观的偏见所影响,而且试题太少,也不能测得全部知识。
为了追求笔试的客观性、精确性和可靠性,20世纪初在美国引发了一场“教育测验运动”。该运动最大的成就是标准化测验的产生。这是一种大规模生产的选择题测验,它有助于许多评分者得出一致的评分结果。
标准化测验可以分为两大类,即常模参照和标准参照的标准化测验。常模参照的测验是用来表明指定的学生或学生群体,与相同年龄和年级的其他测验对象相比,处于什么样的水平。常模参照测验不是用来揭示学生知道什么或者能做什么,而是看他们与全国范围的同龄人相比,其表现如何。标准参照测验是用来表明与期望的标准(一名学生在一定年龄应该知道什么)或一个具体目标相比较时学生的表现情况。这些测验的题目试图揭示学生在知识或技能方面的长处或弱点。能力测验和成就测验都属于标准参照测验,尽管两类测验的目的不同,但对大多数教师和学生来说,二者看起来是一样的,他们往往更关注的是测验的结果,而不是测验的类型。
标准化测验的突出特点就是客观、精确,有利于比较。因此,标准化测验往往是高利害的,被视为判断一所学校或一个学区的教育质量好坏的最主要的手段。然而,标准化测验的高利害性,直接导致的后果就是教师按照测验目标来教,而不重视课程本身,学生取得的成绩也仅与考试目标紧密相关,而不是与课程目标相关。当利害性升高时,人们对标准化测验批评的声音也变得越来越大。批评者对标准化测验的不满主要表现在三个方面:第一,测验本身是有缺陷的,其科学性和客观性值得怀疑;第二,除了对学生的测验能力进行测量外,标准化测验不能对其他方面进行有效的预测;第三,标准化测验破坏了他们应该改善的真实过程。他们认为,选择题测验通过以下一些方式破坏了教和学:其一,以理解和反思为代价,对死记硬背的学习重视太多;其二,加深了这样一个误导印象,即对大多数问题来说,只有一个唯一正确的答案;其三,把学生变成被动学习者,他们只需要再认,而不是建构答案和解决方法;其四,强迫教师更关注什么易于测验,而不是关注对学生来说什么重要;其五,把所教的任何内容都转化为选择题形式,从而弱化了内容和技能的发展。
2.另类评价方式的兴起
进入20世纪90年代以来,世界各国的教育改革运动此起彼伏。在学习评价改革中,旨在弥补过度依赖传统标准化测验所导致的缺陷的评价方式应运而生,这些方式由于与传统的标准化测验格格不入,被统称为“另类评价”。“另类评价”的概念和其他概念一样,不同的人会有不同的理解,甚至是争议。许多人认为它与“真实性评价”或“表现性评价”同义。
另类评价的主要方法有以下七种,一是建构性反应题,即要求学生写出问题答案,而不像标准化测验那样从多种答案中加以选择。在这类反应题中,正确的答案可以是一个或多个,回答的形式也可以有所不同。这种形式包括填空、解数字题、填写图表、写出几何证明步骤等。二是分析短文。分析短文是要求学生用一两段文字进行描述、分析、解释、总结,可以有效地评价学生对某门学科的理解程度。回答这类问题,学生需要具备分析、综合、批判思维的能力。三是写作。写作能评价学生必须具备的写作技能,如创造性、修改文章和概括目的和对象,清晰表达自己思想观点的能力,检查学生语言、句法、语法知识等。四是口头演说。通过让学生进行口头演说,亦可了解其语言能力,以及思维的灵敏性。五是展示。展示可以用来全面地考查学生的技能技巧,它要求学生在课堂上或其他观众面前进行演示或生动的表演。教师和训练有素的评价者根据已知的标准评分,一般要求学生具备广泛的能力,经常是跨学科的,并要求学生表现出主动性和创造性。六是实验。主要是考查学生对科学知识的理解和实验过程的操作。在科学课程中,越来越重视对学生主动探究能力的培养,实验要求学生进行一系列的探究活动,如提出假设、拟定计划和进行实验、写出研究报告、应用测量和预见的技巧、应用科学事实和理性概念的知识等。七是档案袋。收集学生自认为能代表自己水平的平时作业,包括草稿、修改稿和最后的作品,要求学生在完成作品后,进行自我评价,并说明选择该作品的理由。
另类评价强调学生各种能力并用,无严格时间限制。根据海曼、阿克伯切、文特斯的归纳,另类评价具有以下六个特征:第一,要求学生演示、创造、制作或动手做某事;第二,要求激发学生高水准的思维能力和解题技能;第三,使用有意义的教学活动作为评价的任务;第四,唤起真实情景的运用;第五,人工计分;第六,要求教师在教学和评价中担任新的角色。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。