区域基础教育质量评价研究是一个极富探索性的课题。在研究和实践过程,人们需要广泛收集和分析相关文献。这些文献包括国外相关文献和国内相关文献两个方面。
一、国外相关文献分析
基础教育质量评价的国外文献主要涉及以下六个方面文献。
(一)不同的质量观相关文献分析
国外著名管理学家对质量、质量管理、质量改进等论题提出了不同的看法。
美国质量理论的重要贡献者戴明(Deming)特别强调持续不断地改进质量的意义,他认为,质量不佳并非员工的过错,而是源于对系统的持续改进方面的不良管理。他提出质量管理的14个要点:确立坚定的目标;采纳新哲学;停止大量的检验;结束仅仅依靠价格选择供应商的做法;持续改进系统;进行工作岗位培训;提升领导能力;消除恐惧心理,打破部门之间的障碍;消除滥用口号的做法;取消工作标准;排除其他障碍;使员工以自己的工作为荣;制订教育计划和自我改进计划;让所有员工都积极参与。[4]
朱兰(Julan)强调质量管理的三个重要的相互关联的过程,即计划、控制和改进。一切质量改进都是从质量计划开始的。质量计划的目的就是给运营部门提供生产出符合顾客需求的产品的方法。质量控制包括收集与过程有关的数据,以确保过程的一致性。组织内部的质量改进应以项目实施的方式进行,对项目进行优先性排序。[5]
美国管理学家费根鲍姆(Feigenbaum)提出了新质量改进观,它包括质量领导、质量技术和组织承诺三个要素。质量领导是质量改进的驱动力,质量技术包括可用来改进技术的统计分析与机器设备,组织承诺则是指所有人都努力改进质量。[6]
美国管理学家克劳斯比(Crosby)提出质量是免费的这一重要观点。他认为:“质量是免费的,虽然它不是礼物(可以不劳而获),却是免费的。真正费钱的是不合质量标准的事情,也即没有在第一次做对。”[7]克劳斯比对五个错误的假设进行了批评:第一个错误的假设认定,质量就是美好的东西,它们昂贵耀眼、光彩夺目;第二个错误的假设认定,质量是无形的抽象名词,无法进行评估和测试;第三个错误的假设认定,质量有经济成本;第四个错误的假设认定,所有质量问题都是由生产线上作业的人造成的,它经常发生在制造业的生产线上;第五个错误的假设认定,质量是质量管理部门的人员所应该做的事。[8]
美国学者福斯特(Foster)认为,没有任何单一方法或灵丹妙药可使公司改进质量,为此他提出审视质量管理的集成方法。“所谓集成方法,是指从系统全面的观点看待质量和质量管理问题,构建质量理念、质量管理体系、质量管理方法等方面的系统框架。”[9]
(二)质量评价
从质量管理角度看,质量评价是指对实体具备满足规定要求能力的程度所做的系统性的检查和结果分析。从运行过程角度看,质量评价是对某一指定区域产品和服务质量的优劣程度进行定性和定量的描述和评定。根据需要评价的时间段的不同,质量评价可分为回顾评价、现状评价和预测评价三种。回顾评价可以分析质量的演变过程和变化规律,现状评价可以了解质量的现实状况,预测评价可以了解质量的发展趋势。这三种评价均对确定质量状况有一定的帮助。
王立志、李钊指出:“产品质量的评价体系应从符合性、适应性和外部性三个方面进行设计。遵循科学合理、易于理解和实施的原则,可设计和使用抽查合格率、质量损失率、回收利用率、产品投诉率和顾客满意度等五个指标。”[10]
(三)教育质量概念界定相关文献分析
瑞典学者托斯坦·胡森(Torsten Husen)认为:“质量指教育的产品,而不是指生产出这些产品的资源和过程。质量是指学校里进行某些教育活动的目标达到什么程度。”[11]米亚拉雷(Mialaret)早在1985年就提出,教育质量的一般性定义应强调两个方面:一是以一般的或具体的方式表达的社会期望;二是教育过程的实际特征以及在学习水平上所观察到的变化。[12]联合国儿童发展基金会在《教育质量定义》这一文件中提出了教育质量的五个要素:学习者、教育环境、教育内容、教育过程和教育成果。[13]联合国在《2005年全民教育全球监测报告:提高教育质量迫在眉睫》这一报告中,从学习者特征、背景、投入(主要包括教材、基础设施和条件、人力资源)、教与学、结果五个相互关联的维度出发定义教育质量,把教育质量视为一个受政治、文化和经济背景影响的复杂系统。[14]
国际上不少学者将诸如教育制度、教育计划、教育内容、教育过程、教育方法及教育者素质、学生的基础、师生参与教育活动的积极程度等因素也纳入了教育质量的评价范围,并认为教育质量是包含多个维度的概念。这种观点有利于政府和全社会共同承担起提高教育质量和教育水平的责任,从整个社会系统的角度全面提高教育质量和水平。
(四)基础教育质量评价的作用和目的相关文献分析
格兰特·威金斯(Glant Wiggins)在《教育性评价》一书中提出了新的评价功能观。他认为:“教育性评价的根本作用是改进学生的表现,而不是‘审判’学生,评价应该具有真实性和反馈性,不能脱离生活和学生的实际。”[15]
国际教育发展委员会在《学会生存:教育世界的今天和明天》一书中提出了新的学生学习成绩评价观。“对于大中小学成绩的真正评定,不应以简单的、速战速决的考试为基础,而应以全面观察整个学习过程中的工作为基础。评定应少注意学生所记忆的知识有多少,而应多注意学生智力的发展,即推理能力、批判性的判断力、解决问题的熟练程度等方面的发展。”[16]
厄内斯特·波伊尔(Ernest Boyer)探讨了基础教育质量评价的目的。他指出:“基础学校是一个负责任的学校,它对家长、学生、社区负有责任。学校制定了语言和核心知识成绩的标准,并使用指标以监控学生的学习成绩。学校关注学生个人素质和社会素质,并由老师作正式的评估。基础学校所做的评价是为学习服务的。”[17]“基础学校评价的目的不仅仅是加强社区,更在于丰富学习的环境,为每个学生的成功创造更好的机会。在基础学校,测量结果意味着寻找切实可行的方法,来肯定和加强每个孩子的这种潜能。”[18]
(五)基础教育质量评价的政策引领相关文献分析
随着世界各国对基础教育质量问题越来越重视,不同国家宏观层面的质量评价更加注重细分不同评价层次。这是因为基础教育系统本身是分级管理的系统。传统的基础教育质量评价忽视了这种层次结构,从而忽略了系统内部许多重要特性。为了克服这一局限性,反映基础教育系统运行状态的评价应该考虑不同级别教育的结构和功能的差异。基础教育质量评价指标既要综合考察投入、过程和产出之间的关系,也要考虑学生、班级和学校的特点。
国际上最有影响的基础教育评价项目之一是国际学生评价计划(Programme for International Student Assessment,PISA)。它是经济合作与发展组织(OECD)发起并组织实施的评价项目,该评价项目的目标是建立常规的、可靠的、与政策相关的学生成就评价指标体系,帮助各国政府和决策者评价和监控国家的教育成效。2006年度国际学生评价计划实施中,有58个国家和地区参与,抽取约1.4万所学校样本,超过39万名学生参加了测试。评价的群体为15岁在校生,评价领域为阅读、数学、科学,评价工具是13套经过等值处理的试题册;每个学生完成一套2小时题量的测试并填写调查问卷表。
国际学生评价计划是建立在终身学习理念基础上的评价计划。为了拥有终身学习的能力,学生需要在阅读、数学及科学能力方面形成稳固的基础;同时懂得安排及调节自己的学习进度,学会独立学习和团队学习,学会解决学习过程中所遇到的困难,还必须注意使用思考方式、学习策略及方法。为全面评估学生以上各项能力,在国际学生评价计划实施中,除了评估15岁学生的知识及技能外,还要求学生报告其学习情况,从而了解他们的学习动机及学习模式。测试内容不局限于学生所学的课程内容、学生在学校里所获得的知识,而是把着眼点放在实际社会生活情境中的知识应用。[19]国际学生评价计划中的数学测试主要从数学技能、数学概念、数学课程因素和数学情境四个领域展开,其中数学技能和数学概念为主要领域,数学课程因素和数学情境则是次要领域。国际学生评价计划中的科学测试主要从科学概念、科学方法和科学情境三个角度进行测试。国际学生评价计划中的阅读测试主要从获取信息、理解信息和思考与判断能力三个方面进行测试。[20]
国际学生评价计划实施中的问卷主要收集学生及其所在学校的特点,其目的是为了确定与学生表现相关的社会、文化、经济以及教育方面的因素。它有三个方面的作用:(1)提供学生的基本人口维度的信息,以便对学生的成绩进行分类比较;(2)提供学生生活和学习背景信息,力求对学生成绩差异作出合理的解释;(3)为家长、教师和教育决策者提供参考。[21]
国际学生评价计划的测试题目摆脱了具体学科和具体年级的局限性,从更广泛意义上的能力角度来评价15岁学生具备的解决问题的能力,它不局限于在校学到的知识,而是强调所学知识在不同情境中的应用和形成面对实际生活挑战的能力。由于评估内容来源于学生生活的多个方面,而不仅仅反映学校教育的成果,所以它测试的成绩不能简单用来分析教师教学的好坏或学校教育的成败。但是这种评价是从未来社会对人的要求出发的,所以评价的结果对于各个国家和地区的政府制定教育发展的政策具有重要的导向性作用。
国际数学与科学学习成就趋势测评(Trends in International Mathematics and Science Study,TIMSS)是由国际教育成就评价协会(International Association for the Evaluation of Educational Achievement,IEA)在1995年进行的第三次数学和科学成就比较,它选择澳大利亚、韩国、美国、日本、奥地利、德国等41个国家,针对5种不同年级水平的50万学生的数学和科学知识进行了测试和调查。除了测试和问卷调查之外,它还包括课程分析、数学课堂的录像、观察和有关政策研究,它是一个能够帮助参与国家在数学和科学教育方面取得进步的诊断工具。国际数学与科学学习成就趋势测评关注学生的三个不同的阶段:小学后阶段,中学低年级阶段和中学的最后阶段。因为每个国家学生的入学年龄不完全相同,在对学生进行测试时,必须考虑年龄和年级两个因素。[22]
(六)基础教育质量评价的改革进展相关文献分析
不同国家的基础教育质量改进的途径和方式是多种多样的。20世纪90年代以来,美国通过立法实施国家教育进展评估(National Assessment of Educational Progress,NAEP),它又被称为国家教育报告卡(Nation's Report),其首要目标是向美国公众报告中小学生的教育状况,促进教育质量和学生学业成绩的不断提高。这项评价由美国国会授权、由教育部所属的全国教育统计资料中心管理,由教育考试服务中心(Educational Testing Service,ETS)实施。NAEP的组织者每隔两年对全国进行一次阅读和数学测试,在时间和资金允许的情况下,还定期对写作、科学、历史、地理、公民学、外语、艺术等学科进行测试,测试内容主要涉及学校课程和国家课程实施方面学生的共同的知识和技能的掌握情况。评价结束后,NAEP的组织者向公众报告四年级、八年级和十二年级学生的学业进展情况。NAEP包括几种类型的评价方式,即全国评价、州评价和试点城市评价。(www.xing528.com)
在评价目的上,作为全国成绩评定方式,它的目的不是指导教师如何进行教学,而是向公众、政策制定者和教育者提供学生在各个学科方面能力的相关信息。在评价工具设计上,NAEP组织者通过分层抽样方法对全国中小学进行抽样,测量学生成绩,也用矩阵方法对试题进行设计。设计的试题分成很多小项目,分别由不同社区、学区、州的学生完成,每个学生完成的题目数量有严格的限定。评价内容既包括学生在数学、阅读、写作、历史、科学等学科学业水平的发展趋势,也包括对影响学生能力发展的各种因素的大规模调查。调查内容包括学校教育情况、家庭教育背景等,调查对象包括学生、教师、校长和家长。
实施教育绩效评价(performance assessment)是20世纪50年代以来美国基础教育评价改革的主要趋势。它以“标准化教育”改革运动为契机,以“保障教育平等,促进教育卓越”为使命。20世纪90年代初,美国一些州开始实施以学校为主要责任单位的新教育绩效制。进入21世纪,基于教育绩效理念而制定的《不让一个孩子掉队法》,进一步加大了美国州政府及地方政府对中小学教育的干预力度,推进了学校教育评价改革的深化。此次改革的一个根本宗旨是落实教育绩效制,提高学生学业成绩。但由谁来负责任,负什么样的责任,如何负责却是颇有争议的问题。教育责任的划分,在某种程度上改变了评估形式,如评估学习的条件和资源,包括学校领导、教师教学、政府财政支持和社区协助等。虽然美国现行公立教育系统绩效评价制度业已普遍建立,但不同的州和学区在具体的评价方法、绩效政策、实施途径和奖惩措施上却有所不同。沈南山、李森指出:“美国中小学教育绩效评价的实施既源于政治、经济、文化变革等外部原因,也源于学校及相关利益主体追求自身利益的内部原因,它所蕴含的业绩文化和绩效责任文化对我国基础教育评价改革有许多有益的启示。”[23]
英国基础教育质量评价的改革力度也不小。英国颁布的《1988年教育改革法》规定,义务教育阶段可划分为四个关键阶段:KS1,5~7岁;KS2,7~11岁;KS3,11~14岁;KS4,14~16岁,国家分别对7、11、14和16岁的学生在国家统一课程中各科目的学习情况进行全国范围的统一评定。也就是说,在7岁时,所有学生都要参加国家的语文和数学测试;在11岁时,除了参加语文和数学测试外,还需参加科学测试;在14岁时,参加与第二阶段相同科目的测试(这三个阶段的测试叫做国家课程评价(SA TS));在16岁时,参加剑桥评价等机构举办的中等教育证书考试(GCSE),考试科目不再限于语文、数学和科学,数量多达50余种,学生在其中任选9门参加考试,国家要求所有考生至少要达到C级水平。国家课程评价不仅进行统一的测试,还要求教师把自己平时对学生的评价与统一考试相结合。教师评价要求根据自己对学生的观察、学生的课堂表现以及作业情况,对学生在各个目标上的水平作出判断。
一帆探讨了澳大利亚教育质量评价改革问题。澳大利亚教育进展评价(National Assessment Program,NAP)是澳大利亚政府于2008年推出的全国性评价项目,NAP由联邦政府批准设立并划拨专款,对中小学3、5、7、9年级的各个学科情况进行全面的测评,对各地教育水平作出定期的、系统的评价。从2009年开始,澳大利亚所有学生均要参加NAP,统一阅卷,统一进行统计分析。此项评价是由澳大利亚政府采用招标方式委托澳大利亚教育研究所(Australia Council for Educational Research,ACER)和澳大利亚考试中心(EAA)等机构分别承担的。题型包括选择题、简答题和问答题,科学科目还有2道实验题,做答方式是采取学生先分班分组做实验,收集数据,然后再由学生单独回答的方式,考试时间为45分钟。NAP的结果报告包括公共报告和技术报告两种,主要提供给政府和学校。[24]
由澳大利亚考试中心(EAA)进行的评价是对学校系统进行的最为全面的评价项目,每年大洋洲各国有170万学生参加考试,另外有来自新加坡、中国、马来西亚、南非、印度尼西亚和印度的70万海外学生在本国参加此项考试。这一评价的考试科目包括:英文(三至十二年级)、数学(三至十二年级)、写作(三至十二年级)、拼写(三至七年级)、科学(三至十二年级)和计算机(三至十年级)。最近EAA又推出了一套一般成就测验(GAT)。每年考试中前1%的学生获得大学金牌,前10%的学生获得优秀证书,其他学生也将获得各类参赛证书,以标明其成绩水平。随着该评价项目的不断推进和数据库资料的逐步积累,它已经越来越成为一项重要的诊断性测验,能比较全面地评价中小学各年级学生的知识和能力。由于经过等值处理,考试后,EAA每年对不同国家进行纵向和横向比较,将不同年级学生的表现放在同一量表上去进行分析,为学校教学和学生学习提供反馈信息。EAA为学生提供诊断报告,明确地指出其优势和劣势;EAA还为参加测评的各个学校提供一份结果分析报告,为评价该校各科教学状况和各个年度的发展情况提供依据。
二、国内相关文献分析
(一)质量含义和作用相关文献分析
龚益鸣探讨了现实中质量提升的三个方面的作用。他认为,质量是国家和社会可持续发展的战略因素,质量不仅是财富的结晶,而且是创造财富的生产力。质量是提升企业竞争力的关键因素,高质量的产品和服务在竞争中总能处于有利的地位。质量也是供需双赢的重要制约因素,企业必须坚持不懈地追求技术创新和质量改进,以满足消费者不断增长的消费需求,在激烈的市场竞争中求生存和发展。[25]
(二)质量评价含义和功能相关文献分析
张延明认为,评估是关于一个组织内部的人在实现组织目标的过程中效率提高和持续发展的问题。在学校里,目标就是学生在各个行为和知识领域的学习掌握程度。评价应是使团体有效实现学校目标的过程。[26]
(三)教育质量概念界定相关文献分析
关于教育质量的定义,学术界的认识不尽相同。这里主要指出三种主张:
一是从教育结果或成果的角度审视教育质量。教育质量取决于培养对象的质量,是教育水平高低和教育效果优劣。陶西平主编的《教育评价辞典》认为,教育质量的衡量标准是教育目标和各级各类学校教育目标的实现程度。[27]“教育水平高低”是指对所有受教育者的一般要求,即教育的根本质量要求;“教育效果优劣”是指对受教育者的具体要求,即衡量培养出来的学生是否达到具体的质量规格。
二是主张教育质量是包括学习者、教育环境、教育内容、教育过程和教育成果等因素的多维度复杂系统。[28]
三是从产品质量的角度,引用“国际标准化组织”的定义,即质量是“实体满足明确或隐含需要的能力的特性的总和”,并继而应用“质量管理与质量保证标准”中的种种理念,来阐释教育质量的内涵。如果把教育理解为一个由输入、过程和输出构成的流程,那么对学生来讲,教育的输入、过程和输出是同等重要的。尽管好的教育输入会导致好的教育过程,好的教育输入和好的教育过程又会导致好的教育结果,但是从满足学生需求和让学生满意的角度讲,这些环节之间,不存在谁为目的和谁为手段的关系。作为向学生提供服务的教育,其质量应该被理解为:教育输入、教育过程和教育结果特性满足学生要求并使学生满意的程度。对于学生而言,教育质量必须通过教育全过程即教育输入、教育过程和教育结果三个方面来体现。[29]从国内对教育质量研究的大量文献中可以看到,尽管对教育质量的提法不同,但都将学习者认知能力的发展作为体现教育质量的主要的、明确的目标。同时,研究者强调学习者态度转变、情感发展的意义。
(四)基础教育质量评价体系相关文献分析
郑富之提出构建国家基础教育质量监测评价体系的四个设想:充分认识建立质量监测评价体系的重要性和紧迫性;准确把握质量监测的指导思想和基本原则;明确质量监测的主要内容;认真组织实施。他主张,全国基础教育质量监测结果显示的是国家基础教育的状况、水平与特征,对全国基础教育质量的跟踪监控将影响国家对基础教育管理的政策选择。因此,当务之急是成立国家基础教育质量监测指导委员会,负责对监测工作的统筹和指导,并设立专门机构开展工作:尽快成立国家基础教育质量监测中心,制定教育质量监测标准,研发监测工具;开展基础教育质量监测工作;为各地开展教育质量监测提供技术支持和业务指导;整合全国相关专业力量,形成一支由课程、学科和教育评价、学业测量等方面的专家组成的专兼结合的专门化队伍,为教育质量监测工作提供学术咨询和支持,创新监测工作运行机制。建立国家基础教育质量监测的专业机构,是一项开创性的工作。为了确保工作的高效、有序,人们必须以创新的模式来构建监测机构的管理和运行机制。[30]
(五)基础教育质量监控相关文献分析
不同的教育质量观衍生出对教育质量监控的不同理解。王毓认为,教育质量监控是监控组织通过对本国关键年龄段学生学习情况在一定时间间隔内进行抽样测试,及时发现可能存在的质量问题,以便教育决策部门制定教育政策,控制教育行为,从而提高国家教育质量的过程。[31]
文喆认为,教育质量监控不仅包括效果监控,更重要的是对学校办学硬件及软件条件的要素监控。例如,为学校提供实用的校舍和场地;适合的设施与图书以及合格甚至优良的教师队伍;为学校发展提供必要的社会、社区的支持与保证,包括有经费的保证,有鼓励创新、鼓励探究、支持学校与社会社区结合的环境与氛围的保证等;进行流程监控,如加强对教育过程、教育实践的全过程管理,了解各种教育环节的工作与质量状况,了解教学实施的各个环节。这些方面都应有必要的要求,也应有及时的情况了解与信息反馈。对这些具体环节,不仅教师要有设计、有操作、有变通发展、有反思提升,校长和一切从事教育管理的人,也应该了然于心,有数据,有例证,真正参与到教育过程、教育管理中。他认为,教育要素和教育过程是真正决定教育质量的关键因素,要素监控、流程监控和效果监控要做到三位一体。[32]
目前,国内关于区域教育质量监控的理论研究较少。相关研究主要涉及以下三个方面问题:
第一,对区域开展教育质量监控的意义和原则展开讨论。洪松舟、汪琪认为,实施教育质量评价是区域教育实践和发展的诉求,对于学校、教育行政部门和社会都有非常重要的实践价值,目的在于提供反馈和指导,促进区域教育均衡发展,促进县级政府提高教育管理和决策的科学水平,推进素质教育的实施和促进教育公平。[33]
唐华生认为,在实践中,一要充分发挥政府主体的作用、学校主体的作用和社会主体的作用;二要围绕教育目的、教育过程和教育结果开展监控;三要构建质量监控的队伍支持机制、投入保障机制和信息反馈机制;四要运用单项监控与综合监控相结合、个体监控与群体监控相结合、静态监控与动态监控相结合的方法;五要遵循质量监控的规范性原则、整体性原则和发展性原则。[34]
第二,研究国外学区管理的成功案例。乐毅注意到越来越多的美国中小学喊出了“向管理要质量”的口号。通过对美国得克萨斯州布拉索斯伯特独立学区成功地将教育全面质量管理理论和美国国家质量奖标准运用于学区学校管理实际的实践案例进行研究,可以发现,为使学区内学校走出困境、提高管理效率,不仅需要政策的支持,更需要现代管理理论的指导以及相应的国家级学校质量评价标准的驱动。依据国家质量标准,运用现代管理思想,更多关注并做好学区层面学校管理的规划和实施,将是今后质量评价和监控的一个研究亮点。[35]
洪松舟、汪琪认为,区域教育质量监测包括基础性监测、过程性监测和结果性监测,针对本区域基础教育的办学机构及参加人员,运用多元方法,按学科、分阶段进行全面监测,其基本程序包括建立标准、施测、反馈、问责、干预,设置监测机构,并由专兼职人员实施具体监测工作。[36]
第三,对区域教育质量监控存在的问题进行分析并提出对策建议。任春荣认为,区域教育质量监测作为新生事物,还存在一系列问题,需要在提高监测人员素质、促进监测工作标准化、改进监测内容和形式、多角度分析监测数据等方面改进工作。[37]
就区域教育质量评价的实践探索而言,从2007年开始,上海市浦东区,北京市东城区、海淀区先后开展了基础教育质量监控工作,摸索出了一些有价值的先进经验。在测试内容上,除语文、数学、英语等学科外,海淀区进行了美术和科学等学科测试。在测试方式上,东城区实施了英语实践能力的人机对话和口语测试。[38]海淀区改进了教育教学与管理实践,结合测试提供调研结果。在实施技术上,浦东区建立了网络环境下区域性学习质量监测系统,具体分析了学科学习与教师、家长等因素的关系,并提出了对策和建议。教研部门实施质量监控在一定程度上提高了学校和教师对教育质量的关注度,为学校、教师找到重点问题和教学突破口提供了帮助。
目前,基础教育质量监控本身还存在一些问题需要思考:一是以监测代替监控是否恰当、科学?如何实施监控才能整体提高区(县)的教育质量?二是谁来监控才能保证监控的结果客观?监控的力度如何得到落实?监测后学校从面临的现实问题到实践改进的行动,如何得到专业人员指导?三是如何科学地评估县(市、区)基础教育的监控水平。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。