首页 理论教育 科学真实的课堂测量方法

科学真实的课堂测量方法

时间:2023-08-01 理论教育 版权反馈
【摘要】:准确的评价需要真实的测量方法,而不是一系列标准化的数字。访谈结束后,检查访谈记录,并和小学生讨论你的故事方案。案例一某学校要求六年级学生参加秋季全国标准化成就测验,所以班主任刘老师在秋季对学生进行了测验指导。案例二而另一所学校的李老师为了使他的学生能够在全国社会测验中取得好成绩,他让学生做测验模拟题。所以刘老师的测验准备工作很不符合要求。

科学真实的课堂测量方法

准确的评价需要真实的测量方法,而不是一系列标准化的数字。时代已经变了,就拿数学教师来说吧,他们承认自己在教学生怎样应用数学理论方面已经走了很长的一段路,现在的教育更强调对于学生反省性思维、观察和批判性思维能力的培养,这对于某些学科,尤其是对数学来说,不是那么容易做到的。

一位教师叙述了他帮助学生发现他们怎样进行数学思维的策略。开始,他鼓励学生超越那些传统机械的数学方法的束缚,从而使学生在较高水平的思维或者无认知(对自己思维的思维)活动方面获得成功。后来,这位教师让他的学生和邻近小学中学习落后的小学生进行合作学习。学生们都喜欢这种学习形式,并且愿意观察小学生,以发现他们是如何进行数学思维的。

在这项任务中,教师们要求学生做好观察记录,并且要记下自己对小学生思维能力的思考,结果证明:这种合作学习的形式是很成功的。小学生很高兴请高年级的学生帮助他们解决难题,高年级的学生也认真记录着这些小学生运用多种基础数学技能的过程。由于两个班级的积极响应,这次的合作学习已经超出了预期计划的时间,并且以学生配对合作解决复杂数学问题的形式宣告结束。这种学习形式比两个班的学生单独学习更为积极有效。它为学习数学的学生提供了一次理论联系实践的机会,其中的几个中学生还应用他们所学到的知识继续帮助小学教师创建数学学习研究中心。

即使十几岁的孩子也愿意在语言和书写任务上与比自己更小的学生合作。例如,为了写一篇描写一年级小学生的文章,他们将从喜好、优缺点等方面对小学生进行访谈,虽然这有一定的难度。但是,当小学生知道要描写自己时,他们就会积极地与大些的学生合作。以下是他们采用的书写任务。

完成一篇描述小朋友的文章

结果:对于一个小朋友做出描述

过程:

❀两人成对设计一组适合访谈一年级学生的问题。

问题可能包括:

1.你最喜欢什么样的故事?

2.给我讲讲你最好的朋友好吗?

3.给我讲讲你最喜欢的宠物好吗?

4.你喜欢玩什么样的游戏?

5.你害怕什么?

6.什么能够逗你发笑?

7.什么能惹你哭?

8.能讲讲你的家庭吗?

9.在学校里你最喜欢什么?最不喜欢什么?

❀对小学生进行访谈,并记录所有问题的答案。可以用学生感兴趣或所关心的事情作为文章的主线。

❀利用访谈所获得的信息写出关于这个孩子的故事,根据孩子的喜好和兴趣使情节个性化。

❀访谈结束后,检查访谈记录,并和小学生讨论你的故事方案。

❀完成故事,读给小学生听并做出相关的解释。在教师做出评价后,还可以把它送给一年级的小学生。

与真实生活相联系的学习任务很容易激发学生的积极性。正如在表7-2中所描述的那样,与小学生合作学习的一个好处是他们乐于接受和赞赏十几岁的孩子,这对于承受着许多同伴压力的中学生来说,无疑是一件好事,而小学生也能从十几岁学生的教导和自己的注意中获益。因此,可以说,这种形式的任务创造了双赢局面。

综上所述,对于重要的评价,教师该如何指导学生作测验准备呢?

教师应该讲授测验代表的知识、技能或者其他相关内容,而不应该直接讲解具体的测验题目。

关于测验准备的思考给了我们很多启示。如果被评价领域有明确的界定,教师就可以只讲授某次高利害测验代表的知识或者技能。我们强调了教师理解测验所代表领域的重要性。如果被评价领域的界定不是很清楚,教师就很难就评价领域的内容组织教学。

但是,提高学生在高利害测验中的成绩,给现在的教师造成的压力太大了,而且这些测验代表的领域没有明确的界定,所以很多教师就很自然地纯粹地讲授测验题目。

章末小结

本章讨论的是一个重要的评价问题——教师如何进行测验评价。在详细分析了提高学生成绩给任课教师造成极大压力的原因之后,本章介绍了两条测验评价准则。这两条准则是:

(1)职业道德规范准则。这条准则规定,任何一种测验评价工作都不能违背教育职业的道德规范;

(2)教育辩护准则。这条准则规定,任何一种测验评价工作都不能仅仅提高学生的测验成绩,而不相应地提高学生对被评价领域知识和技能的掌握水平。另外,本章列举了5种测验准备工作形式:

(1)往年真题形式;

(2)最新真题形式;

(3)测验技巧指导;

(4)模拟形式;

(5)多题型指导。

用上述两条评价准则对这五种测验准备工作形式进行评价,结果表明,其中只有两种形式——测验技巧指导(如果所花时间不多)和多题型指导完全符合两条评价准则的要求。本章还奉劝教师不要说“为测验而教”。

实务操练

在了解了使用两条准则评价测验准备工作的熟练情况,我们列举了两个案例。请你确定一下这两则案例是否完全符合两条准则的要求?(www.xing528.com)

案例一

某学校要求六年级学生参加秋季全国标准化成就测验,所以班主任刘老师在秋季对学生进行了测验指导。庆幸的是,她存有过去几年的大部分测验题目,所以,她可以用两个星期的时间让学生练习过去几年的题目。最后她还进行了一次练习测验,其中60%的题目都出自市场上可买到的全国标准化测验。在学生完成测验之后,刘老师还给了他们一份正确答案,供学生改正自己的错误

这种形式符合要求吗?

你对这种测验准备形式怎样理解?

案例二

而另一所学校的李老师为了使他的学生能够在全国社会测验中取得好成绩,他让学生做测验模拟题。李老师尽量模拟那次全国测验题目的实质,但是他没有直接使用测验中的真实题目。他的测验指导工作都在常规课时完成,绝大部分学生没有意识到李老师是在做测验指导。

这种形式符合要求吗?

你对这种测验准备形式怎样理解?

操练提示

1.刘老师的行为违背了两条评价准则的要求,因为她的这种行为就是很多人所说的彻头彻尾的欺骗,是一种“为测验而教”的虚伪行为。所以刘老师的测验准备工作很不符合要求。我们要引以为戒,且勿使教学陷入“为测验而教”的误区。

2.李老师的行为符合职业道德规范准则的要求,但是却违背了教育辩护准则的要求。不管他的学生知不知道他这种行为的实质,也不要考虑他的这种测验准备工作都是在常规课堂上进行的,李老师的学生是可以在全国测验中表现出一定的社会科学知识水平,但不能在其他情境中灵活应用所学的社会研究技能。

相关思考

1.在传统的标准化测验中,请你评价一下有哪几种测验准备工作完全适合两条准则的要求呢?为什么这样评价呢?

2.大多数教师都抱有这样一种观点,就是“为测验而教”,并为此做了大量的测验准备工作,你认为这种观点正确吗?你怎么看有意识对学生进行的测验指导?

3.除了本章介绍的两条任课教师测验准备工作评价准则外。根据您的教学实践,想一想还有其他的准则吗?如有,请说明。

相关链接

考试改革与教育评价创新

创新教育的实施是一项复杂的系统工程课程教材和教学模式等方面的创新,是否在培养学生创新精神和实践能力上真正取得了效果,都必须依据创新教育的目的和创新人才培养的目标进行价值判断,对创新教育的过程和结果作出科学的评价。

在过去相当长的时期里,我国中小学对学生评价的方式集中表现为考试。传统考试中存在的种种弊端,使教育评价这个教育教学的重要手段,蜕变为“应试教育”的诱因和“栖息地”,成为基础教育领域的“重灾区”。在片面追求升学的导向下,从小学到中学12年时间里,学生要把1/4到1/3的时间用在复习、备考和应试上,考试几乎成为中小学教学的惟一口号,学生几乎被培养成了考试机器。传统考试模式与培养学生创新能力之间存在着激烈的矛盾冲突,从某种意义上讲,它就是制约基础教育全面推进素质教育的“瓶颈”问题。近年来虽已逐步加大改革力度,但问题尚未得到根本性的解决。因此,在探讨创新教育评价问题之前,有必要再次反思传统考试的弊端。

从培养学生创新精神和实践能力的视角分析,这些弊端突出体现在以下两个方面:

一、以考试成绩为惟一准则的筛选机制,导致教育评价标准的异化在教育测量理论里,为常规课程学习组织的各种考试,都属于学业成就测验的范畴。作为学校教育一种有效的管理手段,成就测验是世界各国中、小学都普遍采用的测验方法。成就测验又称为知识测验、学业成就测验,或者有时就被直接称为教育测验。

由于先天和后天各种因素影响,即使在相同的教学过程中,在学生个体或学生群体之间,学习的成效不会完全相同。在这个意义上,成就测验最初曾重点用于对学生进行“分等”,以便激励不同“等级”的学生能够更努力地学习。因此,成就测验也可以用在各种类型的甄别与选拔,如高等学校的入学选拔等。但是,正如教育评价的奠基人泰勒在《变化中的教育评价概念》里指出的那样:“最近在教育的公认观点上发生的深刻变化,使教育评价的概念也发生了相应的变化。标准化的测验发展了服务于挑选学生的最初意图。学院的入学考试和其他选择形式的挑选仍然是测验的一个重要功能,但是它只是许多其他意图之一。”泰勒这里所说的“其它意图”,包括“监视学生的进步”,“鉴定在什么地方、哪类学生,在什么条件下,还没有达到预期的成就水平”等。因此,就中小学常规课程教学而言,考试的目的绝不是为了选拔或择优,它是用来检验学生掌握知识的程度,即考查学生对某一学科或某一组学科的学习成效,测量他们已经具备了哪些知识和技能,为评价教育目标的实现程度提供依据,是检验学习质量、效果和改进教学的一种工具。

然而,“应试教育”的错误导向和重压,使我们的常规课程教学考试也凸显和强化了筛选或选拔机制;考试甚至逐步脱离“工具”身份,替代教育评价成为导向性极强的“指挥棒”,本末倒置地上升为课程教学的中心地位,致使教育评价的标准早已在事实上被异化。

第一,基础教育特别是义务教育阶段,其教育目的主要是为社会主义事业培养合格的劳动者和建设者,不允许放弃任何一个学生。因此,为了每一个学生的发展,教学评价的标准只能建立在普遍适用和必须掌握的知识和能力上,即每个学生在一生中都必须使用的阅读能力、计算能力、写作能力和其他必要的能力,或者说,评价标准只能是满足“基本学习需要”的“低标尺”。1990年,在泰国宗滴恩召开的世界全民教育大会及其后所发布的《世界全民教育宣言:满足基本学习需要》指出:“基本学习需要包括人们为生存下去,为充分发展自己的能力,为有尊严地生活和工作,为充分参与发展,为改善自己的生活质量,为做出有见识的决策,为继续学习所需的基本学习手段和基本学习内容。”

我国中小学的现实情况却违背了这种评价标准。为了提高升学率,达到对学生分等选拔的目的,考试使用了越来越深、越来越难、越来越偏的试题内容以获得区分度。今天中小学考试中出的很多难题,连大学毕业的甚至从事有关专业的专家都难以应付。数学教授解不出中学数学考试的难题,作家无法回答语文考卷中的辨析题,这样的例子比比皆是。在评分标准上,传统考试不考虑学生的努力因素,以便做到“不放弃每一个学生”,而是把那些没有希望考取大学的学生“淘汰出局”,任其“自生自灭”。此外,这种考试也没有根据不同的学生和不同的程度要求区别对待。中国科学院自然科学史研究所阎康年教授在一篇关于考试改革的文章里,以语文、数学和英语三科考试为例指出:“对中小学生而言,语数外三科确实是基础之基础,所以考大学将其作为必考科目。但是,文科和理科对这三门课的基础知识要求程度不同,这是众所周知的事实。如今语文和英语出题深度不少不是中学生应知应会的,而是按文学家和语言学家的要求或水准出题,很多近义词即使我们这些在行多年的人也难答对,甚至有些文学家和翻译家也常望而兴叹,这对于理工科大学生是必要的吗?至于数学出题,有些题目就是数学家看了也摇头,何故苛求于中学生?目前普遍存在中学教师对前沿科技发展情况及其所需的基础科技知识不闻不问,甚至在了解甚少的情况,反而在古代和近代早期的数理知识上搞得十分复杂。其中有些对智力开发有益,但大多并无现实意义,甚至将来做了数学家、物理学家和语言学家也很少能遇到这种偏题。有些问题如数学上求极值或极大、极小等,在初、高中的数学中讲得很多,考题出得相当繁琐,而当学生掌握了微积分微分方程后就很容易解决。升学考试出题和考法是比教育部公布的注意事项和政令还起作用的,它起了实际导向作用,这是不言而喻的,为此必须给予足够的重视。如果上述情况对于准备成为数学家和理论物理学家的学生还能说得过去,那么对于学语言、文字和法律的人又有多少必要呢?”

对大多数学生来说,考试无疑成了学习生活中一场又一场噩梦。爱因斯坦曾经沉痛地表示:“人们为了考试,不论愿意与否,都得把有用无用的废物统统塞进自己的脑袋。这种考试使我如此畏缩不前,以致在我通过最后的考试以后有整整一年对科学问题的任何思考都感到扫兴。”可见,传统考试模式扼杀的恰恰是创新性学习的必要条件——学习的动机和兴趣。

第二,更为严重的是,以考试成绩为惟一评判标准,不断强化筛选或分等功能之后,已经造成学生个性特长普遍失落。在这种考试模式下,创新思维被无情的朱笔挞伐,具有独创性的人才被分数所虐杀。

2000年6月,上海中学生韩寒的“休学事件”,再次引发社会广泛的争论。高中一年级学生韩寒在《萌芽》杂志和七所高校联合举办的两届“新概念”作文大赛上,多篇作品均获一、二等奖;不久前,他描写中学生生活的小说三重门》由作家出版社出版,登上了畅销书的排行榜。可是,热衷于写作的韩寒,各门理科考试成绩全不及格,就连语文期末考试也只有60分,甚至有过不及格的历史。韩寒痛恨老师和家长的开导,坚持办理了休学手续,准备为创作去体验生活。

考试成绩不及格和“偏科”的韩寒究竟算不算人才?怎样看待他的选择?学生、家长、教师和教育专家纷纷提出各种观点迥异的看法。仍然有许多人认识到,考试不及格的学生,完全可以成为成功的人才,这已被实践证明,只是不可能在学校中得到肯定。教育学者杨东平撰文指出:“‘韩寒现象’所凸显的,是学校教育中全面发展的目标和统一标准与学生的个性、兴趣爱好、特长之间的激烈冲突。大规模培养学生的现代学校教育,必需建立相应的制度、规范、培养目标、质量标准;然而,学生是活的,世界上没有两个相同的人。因而,重视学生的个体差异,‘因材施教’也成为教育的另一个重要原则。这正是学校教育与工业生产最大的区别之一。我们的学校教育无疑应当更为灵活、开放和多样化,以适应不同学生的不同需要……有朝一日,当韩寒那样的偏才、奇才、怪才都可以被学校接纳,得到恰当的教育和自我发展,‘不拘一格’才不再是一句口号。”

反过来讲,韩寒事件对我们当前只有“共性”没有“个性”的考试模式提出了一个严峻的问题:为什么以成绩为惟一选拔标准的考试不可能让具有特长的人脱颖而出?为什么许多考试全优的学生走出校门后,却变得越来越平庸?“全面发展”与“个性发展”能否在创新教育评价标准里获得统一?这些都是教育评价创新需要重点思考的问题。

二、“标准化测验”和“标准答案”严重窒息了学生的创新精神与培养适应工业社会“标准件”式的人才相似,我国中小学大多数考试所采用的主要模式和评价尺度,依然是20世纪初发达国家在普及大众教育运动中形成的“标准化测验”。标准化测验需要大量使用具有“标准答案”的选择题。于是,“标准答案”几乎成为学生和教师在各种考试中追逐的终极目标,甚至演变为十分荒谬的思维定势。

著名作家王蒙在参加“新概念”作文大赛阅卷时说,他曾经做过几次中学语文标准化试卷,成绩都不理想,其中最好的一次成绩也只有60分。这些答案不是A就是B,相当死板。其实中文的用词是很微妙的,有些意思又非常接近,没有上下文,要做出选择,确实很难。王蒙举例说,有一张试卷中有这样的话:“人最宝贵的是生命;人,最宝贵的是生命;生命对于人是最宝贵的;对于人没有比生命更宝贵的。”要求学生选择哪一句是正确的。其实这四句话表达的都是一个意思,不能说只有保尔说过的才是正确的。王蒙认为,现在流行的标准化试卷也许是受英语电脑化、数据化考试的影响。英语里有主动式、被动式等区别,所以用大量的选择题来看学生的基础,但汉语的用词却要复杂得多,用选择题进行测试未必能真正反映出学生的语文基础。

《中国青年报》曾以家长来信形式,披露过另一典型事例:北京某校小学二年级数学测验,有一道题为“10除以5,得多少?”当学生写下“10除以5得2”或“2”等答案时,却被老师判为零分。问起原因,老师的回答是“与区里给出的标准答案不同”,而标准答案规定,该题只能写“得2”。当多次询问无法得到满意的回答后,家长激愤地写道:“数次的经历让我明白,诅咒和埋怨是没有用处的,重要的是不能让孩子被这种僵化的教育毁了。”这些事例迫使我们提出疑问:这种“标准化测验”究竟考的是什么?

1969年诺贝尔物理学奖得主盖尔曼教授曾援引过一篇题为《气压计的故事》的文章,对“标准答案”做过辛辣的讽刺,读来十分有趣。故事说的是华盛顿大学教授卡兰德拉受委托去仲裁一道物理试题的答案,因为教师给某学生判了零分,而学生则声称自己应该得满分。该试题是:“试证明怎么能够用一个气压计测定一栋高楼的高度。”这个学生的答案是:“把气压计拿到高楼顶部,用一根长绳子系住气压计,然后把气压计从楼顶向楼下坠,直坠到街面为止;然后把气压计拉上楼顶,测量绳子放下的长度。这长度即为楼的高度。”卡兰德拉教授认为,这个学生的答案完全正确,可以给他的物理考试打高分;但从另一方面讲,高分就证明这个学生知道一些物理学知识,但他的回答又不能证明这一点。随后,学生马上按物理学要求写出该题的其他许多答案,诸如:让气压计从屋顶落下,记录下落时间,然后以自由落体公式计算距离;记录太阳在气压计和建筑物上照射的影子之长度比,用相似形计算出高楼的高度。等等,但这些都与常规思维的“标准答案”不符。最后,这个学生甚至说,如果不限制我用物理学方法回答这个问题,还有一个更直接的方法,你可以拿着气压计对楼层管理员说:“亲爱的管理员先生,我有一个漂亮的电压表,如果您告诉我这栋楼的高度,我将把这个气压表送给您……”卡兰德拉教授最终给了这个学生几乎是最高的评价,因为在科学课程学习中,没有什么是比创造性思维和想像力还要重要的“标准答案”。

标准化测验对于提高教育效率和推动教育民主化无疑是教育测量的一大进步,但是,这种形式也有无法克服的致命弱点。具有“标准答案”的测验方式,通常只适合于检验对学科知识的覆盖和对事实知识的记忆,而不适合于评估学习的探索过程、思维的创新过程和那些根本不可能具有标准答案的学习范畴。除了部分“可编撰知识”外,其他更重要的“难以表述的知识”,以及能力、态度、个性差异等,都被“标准化测验”拒之门外;创新思维和创新想像,在“标准答案”也没有一席之地。有迹象表明,在标准化测验运动发源的西方发达国家,自20世纪90年代以来,人们已经充分认识到改革这种评价手段的必要性和迫切性,而在过去一段时期内,我国基础教育却把它推而广之,应用到包括文科在内的诸多领域。更为严重的情况是,社会对教育这种价值尺度的普遍认同,进一步误导企事业用人单位和学生家长,不自觉地强化着标准化测验的效能。

我们已经看到,作为“指挥棒”的高考正在逐年加大改革力度,特别在文科试题里,针对“标准答案”造成的负面影响,增大了题型的开放性,鼓励答案的多样化选择。2000年高考语文作文,以“答案是丰富多彩的”为话题,要求考生写出不限文体、不限题目的开放型作文,题目本身也指向了“标准答案”问题。试题给出四种不同的图形和不同的答案判断思路,明确指出“由于标准和角度的不同,这四个图形都可以作为正确答案”。试题还指导学生从哲学高度思考问题:“世界是千变万化的,疑问是层出不穷的,答案是丰富多彩的。在生活中,看问题的角度、对问题的理解、解决问题的方法以及问题的答案不止一个的事例很多。你有这样的经历、体验、见闻和认识吗?”作文要求被设定为“可以记叙经历,编述故事,抒发感情,发表议论,展开想像等”,作文考试再也不能像以往那样背几篇“标准化”的范文就能获取高分,考核的标准已定位于学生的创新思维和想像能力。

创新教育绝非一般地反对考试,也并非一概否认标准化测验在某些场合下的鉴别效果。创新教育反对的是在中小学课程教学中不适当地引入和强化筛选机制,反对的是以那种以复述为重心、以统一答案为标准,并以此作为衡量学生优劣的惟一手段的考试模式。此外,现行考试的过程和教学过程相脱离,测量的结果是学生“知道”什么,而不是学生“能做”什么,所测量的许多内容是被肢解的知识片断,仅靠这种形式无法评价创造能力和综合运用知识的能力,也不可能“筛选”出适合知识经济时代需要的创新人才。

作为学业成就测验的考试,只是教育测量的一种工具。在教育测量学理论里,测验的主要任务是测定客观事实,它提供的只是素材;如果不经过评价的解释,依据目标对测量结果进行价值判断,这些素材就不能充分表明意义。即使从教育测量的角度分析,学业成就测量也只是教育测量诸多类别中的一种。现代社会看重的是建立在能力测验基础上的能力评价,即以创新目标为准绳的事实判断和价值判断。我们要正确认识考试与教育评价的关系,考试不应也不可能替代教育评价的功能;创新教育的实施过程和实施效果只能由教育评价来衡量,并在教育实践中完成评价体系自身的改革、发展和创新任务。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈