(一)确定测验的目的和对象
测验可以具有不同的目的。测验目的不同,其编制的侧重点与技术也应有所不同。同样,测验对象的特征也影响到测验的编制。被测试者的年龄、智力水平和受教育程度不同,所采用的编制技术也应有所不同。
(二)规定测验的内容和形式
在学业成就测验中,要涉及确定该学科内容范围的书面、操作、口试等测试方式。
(三)编制、设计测验蓝图
在编制测验前,首先要设计好测验蓝图,即命题双向细目表。这一环节极为重要,关系到测验能否体现评价的要求,是否有效、可靠,评价者应当认真对待。命题双向细目表具有两个维度:一维是考核的学科知识内容要点,另一维是考核的能力层次(认知水平)。这两个维度体现了考核的整体要求。
设计双向细目表一般包括以下几个基本步骤:
1.考核内容的抽样和考核认知水平的确定
由于一次测验的容量有限,因此评价者不可能对学生已学习的全部内容、已发展的各种认知水平进行全面考核,必须科学地进行抽样。
在大规模的校外考试中,抽样方案一般由学科专家和有教育经验的教师经集体讨论后确定。抽样的基本原则为保持综合平衡。具体来说,测验的内容分布,既要有较宽的覆盖面(如重要章节),又要突出基本或重点部分,做到点面结合;各部分内容的比重,应大致与该部分的教学时数比重相当。测验所考核的认知水平分布也要合理,覆盖各种认知水平(如记忆、理解、应用、综合应用等)。同时,还应当尽量减少单纯记忆的考核,注重理解能力,并适当加强高层次能力(如应用能力)的考核,发挥评价的良好导向功能。
校内测验和考试,常常由任课教师或学校的教导处教师进行命题。上述的抽样策略也同样适用于校内测验。一般来说,由于教师对学生的实际情况更加了解,校内测验应具有更大的灵活性和针对性,如教师可根据教学的具体要求或发现的问题,有意识地加强对学生未充分掌握的内容、或着重培养的认知水平进行考核,使评价为改进教学服务。
2.确定题型和题量
选择题型时,应当主要考虑所要测量学习结果的特性。最适当的题型是由考核目标与学科特点所决定的。
在通盘考虑整个测验的题型时(还要做到主观题与客观题相结合;选答题与自答题相结合),一般说来,校内形成性测验应适当提高自答题的比重,以便了解学生解题的过程和思路,为改进教与学提供充分的信息。
测验总题量的确定受很多因素的制约,主要包括测验时间的长短、题型、阅读、计算机以及文字书写量、试题难度、内容与认知水平的覆盖面等因素。鉴于大部分学业成就测验都不是速度测验,因此应当让学生有充分的时间解题并进行必要的核查,发挥其实际水平。国外的一些负责大规模的校外测验编制的机构,十分重视对题量的研究。他们通过统计在规定时间内考生来不及完成的试题数量及比例,来评价测验的题量是否适当。
3.确定试题的平均难度和难度分布
在编制测验时,一定要考虑试题的平均难度,测验过难或过易,都不利于学生发挥正常的水平。确定试题的平均难度,可采用经验估计的方法,也可通过预测,再计算出试题的难度。试题难度受到多种因素的制约,有些与内容本身的难度有关,如原理、规律通常比事实、术语更难掌握,另一些则与考核的认知水平有关,如单纯考记忆的试题最容易,考理解的试题稍难些,考应用,尤其是考创造性应用的试题难度最大。此外,难度与题型也有一定的关系,如果考察的内容与认知水平相同,选择题一般比要求学生写出答案的题型容易些,因为选择题提供了各种备选答案,学生可从中选正确答案。
不同性质的考试所需的试题平均难度是不同的。例如,我国高考的试题平均难度一般定在0.5~0.6之间,以提高高考的选拔性,而高中毕业会考的试题平均难度一般定在0.7~0.8之间,以保证会考的合格率。
在编制测验时,除了考虑试题的平均难度之外,还要考虑不同难度试题分布情况。一般说来,大部分试题的难度应当在0.2~0.8之间,中等难度的试题数量较多,同时又有一些较容易的试题以及一些较难的试题。在实践中,人们提出了各种难度试题在整个测验中所占的大致比例。如在高考中,容易题、中等难度题和难题的比例大致可定为6∶2∶2;而会考各种难度试题的比例则大致可定为7∶2∶1。(https://www.xing528.com)
4.试题赋分和测验期望分的预估
试题赋分问题是指每道试题应给予多大的满分值。在一定意义上,不同的分值代表了不同的权重,即试题越重要,其分值也越大。因此,试题的赋分会直接影响到测验各部分在试卷中的地位与比重,同时试题的分值也会影响考生的作答时间和精力的分配。测验编制者应当努力使试题的赋分体现命题双向细目表的意图。
主观评分试题的赋分问题比较复杂,在赋分时通常要考虑考核内容在知识技能体系中的地位、认知水平的要求、试题难度和容量、解题所需的技巧与时间等因素。选择题(包括其他可客观评分的题型)的赋分则比较简单。人们一般都赋以选择题相同的分值,而不过多考虑其他的因素。因为选择题的题量较大,赋以相同的分值,可以方便地把试题得分组合成总分。
有了试题的预估难度及试题的分值,便可估算出测验的期望平均得分。人们可根据这一预估的测验期望分,对试题的难度和赋分进行微调,使测验既体现其预定的意图,又较好地符合学生的实际。
双向细目表是编制测验的蓝图,它由两个维度组成:一维是考核的学科知识内容要点;另一维是考核的能力层次(认知水平)。这两个维度体现了考核的整体要求。
(四)命题
试卷质量取决于试题质量,因此,命制良好的试题是测验编制中最核心的环节。编制高质量的试题要花费大量的资源,对命题者的素质要求也很高,如能熟练把握命题的基本规范与技巧等。有些试题的命制,还需要命题者发挥其创造性思维。
目前,我国大规模的校外考试(如高考及高中毕业会考)已开始采用征题与命题相结合的方式进行命题组卷,即按照测验的双向细目表的意图,制定出命题的范围和要求,向有关人士广泛征集试题,形成初步的试题素材库,然后,再由专业的命题人员选择、修改,并命制一些新题,组合成试卷。国外大规模考试的命题周期大多很长。如美国两大高校入学考试——学术性向测验(SAT,由考试服务中心编制中心编制)、教育发展组试(ACT,由美国高校测试中心编制)的命题周期长达1年半至2年。严格的命题程序和持续的监控、修订有效地保证了测验编制的质量。
校内测验编制一般都采用有关教师在考前临时命制的方式由于各种因素(如时间、经验、专业素质等)的制约,命题质量与大规模的校外考试存在较大的差距。下面的命题技术部分,将介绍一些不同题型以及不同认知水平的命题规范。了解并掌握这些规范,将有助于教师提高自己的命题水平。
(五)试测和试题统计分析
试测是指将命制好的试题在具有代表性的样本中进行预先测试。这是国外大规模考试命制试卷时,对试题进行进一步筛选的常用措施。根据试测样本的反应,可以计算出试题的各种性能指标(如难度、区分度等)。测验编制者可以利用这些指标对试题进行修改、筛选、更换,以确保正式试卷中每道试题都具有较高的质量。
(六)组卷
组卷是指把命制好的试题按一定的标准组合成试卷。可采用许多不同的标准进行组卷,如按考核内容组卷、按考核的认知水平组卷等。但国内外最常用的组卷方式是按题型组卷,即把相同题型的试题编在一起。这样做的好处是每种题型只要写一次指示语,十分简明、醒目。
组卷时还有一些基本的规则,如试题应当尽可能按由易到难的顺序排列;指示语要准确,使学生了解解答的要求;排版要方便学生阅读和回答,并有利于评分统计等。
目前,许多校外大规模考试,均采用客观题与主观题相结合的形式。通常对选择题部分提供单独答卷纸,以便机器阅卷,提高效率。国外一些考试(如TOEFL)为了防止作弊,在组卷时采用调整题序印制试卷的策略,使相邻考生相同题号的试题内容不同,有效地排除了考生相互抄袭而获益的可能性,从而提高了考试的效度。
(七)制定评分细则
评分细则的制定是测验编制的最后环节。命题者应当较详尽地列出评分的要点,给分的原则。评分细则应当具有较强的规范性和可操作性,以便为阅卷、评分者提供统一的标准,尽量减少评分误差。事实上,不管事先制定的评分细则多么详尽,在阅卷过程中,还会出现各种预料不到的问题。必要时,命题者应根据实际情况再制定补充细则。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。
