1. 评定也是一种教学方法,它有助于学生改进他的学习水平,有助于教师提高他的教学质量。当然评定也是一种辅助性的方法,而不能单独用来进行教学。评定不仅使我们知道学生是否实际受到了教育,而且也必须为我们提供数据,使我们有可能保证教育的质量。因此,评定必须使我们能够知道我们的教学大纲有多大的效果。而且如果我们想引进新的教学方法与新的教学内容和组织教材与确定课程的顺序以改进学生的学习结果,那么我们就必须进行评定。
无论在任何教学过程的开端、中间和结尾中,评定都是重要的。首先,我们必须决定,我们想要取得怎样的学习结果,然后据此来组织教学过程。第二,在学生的学习过程中我们必须决定学生在取得教学目标的进步中已经达到了什么程度,这样就既可以给与学生以反馈和引起他的动机,又可以用来考察教学的效用。第三,从检查学生成绩的角度和从检验教师的教材教法的角度来看,我们都有必要去评定学生学习的最后结果。如果我们发现我们的教学目标是不现实的,我们就可以利用这种反馈的材料去重新确定我们的教学目标和修改教学大纲。
2. 评定有下列四个目的:
(1)促进学生的学习。评定的主要目的在于监督学生的学习,客观地检查他们的进步和最后的成绩;如果学生在这两方面都不令人满意,那就要考虑采取一些什么适当的补救办法。但是儿童中心主义的教育家们反对对学生进行评定,因为他们认为,真正重要的教育目标是不可能找到的,而且也是不可能验证的;同时,把客观的评定标准应用于学生的学习,这与人道主义教育的精神是不相容的。他们认为,真正的测量只有在自然科学中才有可能的。但是我们认为,虽然根据学生行为上的表现去进行测验不可能产生象自然科学中那样确切、可靠、有效的资料数据,但是这种事实并不妨碍我们在心理学和教育学中构成一些相当可靠和有效的测验工具,或者说,并不妨碍我们利用这些测验工具去评定学生的成绩和教学的程序。
除了监督学生的学习以外,评定还在下列几方面促进学生的学习:① 评定可以鼓舞教师明确地陈述他们的教学目的并把他们对学生的期望告诉学生,因为教师所出的考试题目最确切地指明了教师认为重要的知识与技能。② 考试本身就是一种重要的学习方式,因为它要求学生在测验之前就要复习、记忆、澄清和概括教材内容。③ 考试在推动学生去学习方面起着很重要的作用,因为如果不给学生定期的考试而期望学生系统地、有规律地、自觉地去学习,这是不现实的。④ 学生由于体验到外在的赞扬而感到愉快,他就可以逐渐学会如何独立地去评定他自己的成绩而这种自我评定可以大大地提高他的成绩。
(2)促进教师的教学。评定为检查教师的教学效果提供了必不可少的反馈。评定指明了:教师陈述和组织教材有什么效果,他们解释概念是否清楚,他们是否很好地帮助成绩差的学生,他们所采取的教学方法具有多大的效用等等。从考试中进行反馈可以帮助教师发现哪些地方还需要进一步解释、澄清和复习,可以帮助教师诊断学生有哪些学习上的困难。
(3)衡量课程和对课程作出判断。评定对于衡量课程的价值也是必要的,它们有助于我们估计课程的某种特殊顺序和组织的优点并估计某种教材教法对于教学有什么效果。评定所提供的教学有助于行政当局决定把什么教材放在哪个年级最好以及一个学课最好采取什么教学顺序。总之,对于课程和学习过程的探讨是不可能没有有效的措施去表明学习的结果的。
(4)有助于对学生进行指导、提供咨询和进行个别教学。对于学生的能力、成绩、动机、人格、态度和兴趣进行系统的评定,对于学生进行个别教学,予以个别指导,提供咨询,是必要的。如果我们要准备适合学生能力发展水平的课程与教材,和考虑他们能够接受的教学方法,我们就必须事先知道学生当时的能力水平和已经具有的知识结构。
3. 反对评定的意见。
(1)教育测验往往测量教材中比较烦琐、分散、容易测验的东西而忽视了测量学生真正的理解力、独创性和解决问题的能力。这个批评只有涉及早年测量对事实的机械记忆时才有效。但必须记住,目前对于一般原理的理解以及解释与运用知识的能力也已经有了客观的测验方法。此外,我们还可以利用其他的测量设计去评定某些难以摸触的教育结果。这种测量设计包括观察、同学的决断、口试、写论文、写研究报告等等。不错,为了有效地测量这类重要的特性与能力,如创造性、解决问题的办法、灵活性、对困难的敏感性等,我们还需要进一步研究,但是这不能作为理由来证明当前我们在测量设计方面所遇到的困难是不可克服的。
(2)有人认为,一个特殊的学校制度,一个特殊的课程,一个特殊的学校或教师都各自有他特有的目标,而教育测验不能验证他们是否已经达到这种目标。这种反对的意见是错误地把全国性的标准测验和特殊的教育测验对立起来了。要知道,利用广泛的标准测验和利用为一个特殊学校制度、特殊的课程、特殊的学校或课室所准备的测验,这两者是并不冲突的,在可行的地方,这两种测验都是可以利用的,而且都是应该利用的。
(3)学校里的分数本身往往会成为学习的目的,而没有把这种成绩和分数所代表的知识的重要性和有效性当作寻求的目的。于是当学生考试不及格时,他就对学习不再感到兴趣了;当社会重视测验成绩或某个有声誉的学校所颁发的证书而不重视一个人的真正学术水平和他从事一种专业的真实本领时,学生就会因为他的成绩低劣或得不到一张优良学校的证书而感到心灰意懒或丧失自信心。但是这种把成绩本身当作学习目的的倾向以及认为成绩比这种成绩所代表的知识还要重要的倾向只是反映了社会对于学术价值的一种不正确的态度,而不是产生这种态度的原因或是测验与评定所不可避免的一种结果。因此,过分重视测验的竞争性和利用测验成绩去划分各人的等级高低,只能告诉我们这种社会本身所具有的缺点,而并不能说明测验的弊病。
(4)儿童中心主义的教育家们坚持:真正的学习、独立的思考和创造性的活动只有在一种“不加评定的”教室气氛之中才有可能培养出来。此外,他们认为,评定与考试造成学生紧张、焦虑、过分的竞争、对于外在动机的重视。我们认为,这种说法有点言过其辞。不错,不明智地和权威性地利用评定的方法可能使学生不加批判地接受别人的观点,压制首创性和产生不必要的焦虑、竞争和各人之间的紧张状态。然而为了指导和推动学习并为批判性的思维与首创性的思想树立必要的标准,合理的评定还是绝对不能少的。要学生在学习时完全没有焦虑,也是不现实的,因为如果学生没有一点焦虑的心情,他就不可能获得有创造性的成绩。此外,外在的动机,在合理的程度上,对于学生保持连续的学习也是必要的,当然最好是最后转变成内在的动机。学校里的分数对于证明学生是否成功地掌握了课程也是重要的,因为在儿童时期和青少年时期它可以使学生养成自尊心。(www.xing528.com)
(5)教师经常利用评定来作为奖惩学生的手段,以此来威胁学生服从自己的命令,防止他们的反抗精神。然而对于评定的这种责备也很难构成有效的理由来支持进行对学生成绩不予评定的教学。
(6)能力差的学生一般地都得不到优良的成绩,因此利用最后的成绩作为标准来判断各个学生或者利用成绩来划分学生的等级,这就会使成绩差的学生丧失他们的自尊心,灰心失望而放弃其寻求进步的努力。但是我们还可以根据学生现有的能力水平或与他开始学习时的情况两相比较来评定他现在的成绩。因而我们还是可以避免上述这种结果的。这两种不同的评定根据并不是互相排斥的。
(7)最后,评定有时也并不能促进教学,因为它们可能并不提供有意见的反馈。教师发表学生的成绩往往只是公布一个名单和分数表,而不对学生的作业作任何说明、解释。因此,要避免这种缺点,我们对于学生成绩的评定就要发挥它的诊断作用,帮助他发扬优点,克服缺点。
总之,上述这些毛病是存在的,但是这并不是评定本身的毛病,而毛病出在教师在进行评定时所采取的措施;出在评定的内容与方法;出在学生不明白评定的真正意义和目的等等。这些毛病都是可以纠正的。教育少不了评定,因为要使学生有效地学习,他就必须知道他已经学到什么程度了,还有哪些不足之处;他就必须不断地改正过去的错误和巩固已经取得的成绩。
4. 良好测验的标准。
任何测验,无论是全国性标准化的测验,或是教师个人制订的不正规的测验,都必须是有效用的、可靠的、有代表性的、有鉴别力的和切实可行的。对于这五个标准,我们在下面略作分析。
(1)任何良好的测验都必须是有效用的。一个测验的有效性是指:对于这种测验所想要测量的东西,它已经测量到什么程度了。一个测验的有效性总是和这个测验所提出的目标联系着的。如果一个测验在相当高的程度上已经达到了这个目标所要求测量的东西,这个测验就是好的;它达到这个目标所要求测量的东西的程度很低,它就是不好的。一个有效的成绩测验就是要测量学生所掌握的知识体系是否稳定、清晰、协调组织起来的,足以反映一门学科的知识结构;是否可以长久记住;是否能为进一步学习奠定基础。
(2)一个良好的测验必须是正确的或可靠的。一个测验的可靠性就是指它能产生前后一致的成绩。如果一个体温计连续三次测量同一病人的体温,而它所产生的结果是97°、103°和99.5°,那么这个体温计就是十分不可靠的。有三种相关系数,用来表达大多数心理测验与教育测验的可靠性。第一种是等值系统(co-efficients of equivalence),即当两套彼此比较的项目所产生的两个成绩是相关的时候,我们就说这两个成绩之间具有相关系数,在这种情况之下,便有等值系数。第二种是稳定性系数(co-efficients of stability)。当我们用同一套项目进行测验而其中某一特性在短时间内显得前后一致,恒常不变的时候,我们便有稳定性系数。第三种是普遍性系数。当一个测验是对同一特性进行各种不同而互相关联的测量时,如果这个测验本身是前后一致的,那么这个测验便有普遍性系数(co-efficients of generality)。例如,智力测验包括有许多附属测验,每一附属测验测量智力的一个不同的方面。当这些附属测验的成绩是相互关联的时候,这个平均相关数就可以视为普遍性系数。
(3)一个好的测验必须是具有代表性的。因为我们不可能测验学生在某一门学科内所掌握的所有一切的事实、概念和原理,于是我们便从这些内容中选择一个典型样板,作为估计这个样板所代表的整个内容范围的根据。所以几乎所有的心理测量和教育测量都是以选样的原则为根据的。为了使这个选样程序在逻辑上站得住脚,这种选样程序至少必须符合两个重要的条件:① 这个选出的样板必须恰当地代表整个有关的领域;② 由于要求这种选样必须具有代表性和重要性,这种样板必须是随意选出的。
(4)一个有效的测验必须具有鉴别力。一个有效测验的明显特征就是它能够最大限度地在具有不同程度特性的个人之间加以区别。当然,测验所具有的这个特征一方面是依赖于它对它的组成部分具有鉴别能力,另一方面,也要反映这种测验的可靠性和效用性。然而,这种测验在一定程度上也依赖于整个测量成绩的分布情况。例如,成绩的常态分布显示出对全组的优劣两端有最大的鉴别力而对于中间部分却只有最小的鉴别力。长方形的分布状态,由于全组学生都有相同的成绩,这个测验就能同样地区别全组成员。一个歪斜的分布状态,许多不均匀的成绩聚集在全组的某一端,那么在只有少数成绩的一端具有最大的鉴别力,而相反的一端则只有最小的鉴别力。
(5)一个好的测验必须是切实可行的。在我们能够决定一个测验是否切实可行之前,除了从理论上考虑它的效用性、可靠性、代表性和鉴别力之外,我们还要考虑下列几种实际情况。第一,这种测验所产生的信息结果到底有多大的意义。这就是说,在解释学生的能力、知识、人格特性以及在为他作出教育上和职业上的决定时,这种测验所获得的结果是否有用?例如,一个切实可行的测验应该分别地为学生和教师提供反馈,来检查他们在学与教的方面有什么优缺点并提出理由来说明何以会产生这些优缺点。第二,一个切实可行的测验应该从形式到内容都可以适用于全组受测验的成员。第三,还要考虑到一个测验所需要的经费以及从管理、批分到解释所需要花费的时间。第四,还要考虑批分是否客观;对于测验结果的解释是否正确;在批分和解释时是否还需要什么专门的训练;测验说明书是否为批分和管理提出了说明;是否提供了标准答案;是否为解释测验成绩作出了指导书等等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。