第二节 标准化心理测验的基本要求
目前,世界上有成千上万、种类繁多的心理测验工具。有的是标准化的心理测验工具,有的并不是标准化的心理测验工具。网络上或杂志上的职业自信心的测试,就属于非标准化的心理测验。标准化心理测验,必须具备以下一些要素。
一、信度
信度(reliability)是指测验结果的可靠性或一致性程度。它既包括在时间上的一致性,也包括在内容和不同评分者之间的一致性。信度用信度系数(coefficien eliability)来表示。一般来说,系数越大,一致性就越高,所测分数也就越可靠。
测验在时间上的一致性,是指测量的稳定性水平。一个人在接受一个心理测验后,间隔一段时间再接受同样的心理测验,两次测验结果的一致性就是信度。这种信度系数称为稳定性系数,运用重测信度法计算。即:计算两次测验结果的相关系数。
测验内容的一致性,指测验的两个等值版本之间的一致性,或者正副版本的一致性。教育测试中的AB卷就是一种等值性正副版本。这种信度系数称为等值性系数,一般用另一等值测验与该测验的相关系数表示,也即计算测验正副本的相关系数。
测验的内部一致性也是表示测验信度的一个指标,用分半相关法计算信度。一般将测验分为两个相等的部分,计算两者的相关度,再换算成信度系数。
不同评分者之间的一致性,也是测验信度的一个指标。测验项目的评定,是测验者做出的,不同测验者之间在项目评定上,能否保持一致,是测验信度的一个方面。一般通过一致性检验,考核评定者对项目评定的一致性。
信度是标准化心理测验的必要条件,没有信度的测验工具是没有价值的。如果测验结果没有稳定性,前后测验不一致,或正副版本结果不同,究竟相信哪一个结果?结果又能说明什么呢?如:一个人接受智力测验,一次测验结果是IQ=80,另一次结果是IQ=60,这位受测者的智力水平到底是多少,我们无法知道。因此,没有信度的测验工具是不能使用的,一个可靠性测量工具首先必须具有较高的信度。
二、效度(www.xing528.com)
效度(validity)是指测量的真实性、准确性程度。也就是指测验是否能够真实地反应所要测定的东西。测验的效度越高,从而表示它所测量的结果越能代表所测行为的真实特征。要测量一个人的智力水平,如果实际的测验结果可以非常好地反映此人的智力水平,我们就说,此测验的效度高。如测验结果说明的是此人的气质类型,那么,此测量工具的效度就较低。因为,该测验结果没有测出所要测量的智力,测验的效度可分为:效标效度、内容效度和结构效度。常用效度系数表示。
效标效度,用效标关联系数表示。可用一个成熟的标准测验作为效标,计算该测验与它的相关,所得相关系数即为效标关联系数。内容效度,一般由有关的专家来评判,什么内容可测出所要测量的特征。结构效度,所测内容是否测出了该心理特性所含的结构,一般可用内在一致性表示,也有用因素分析法来分析。
信度是效度的保证。如果每次测验结果都不一致,我们当然就没有必要知道它测的是什么。效度是测量中的核心。我们测量的目的就是对心理进行量的描述,如果测量的结果不是我们所要测量的东西,测量也就没有任何意义了。
三、标准化
任何标准化心理测验都要有统一的实施办法、标准指导语、实施时间及明确的计分标准,以保证测量结果不受时间、地点、人员等的影响。测量的标准化(standardization)是指心理测验的编制和施测程序在任何测验情境中均是一致的。指导语、计分方法、材料呈现等等,对每一位受测者来说都是相同的。有测验标准化,才能解释和说明测验的结果。
心理测验的标准化还有另外一个内容,就是测验要有常模(norm)。常模是指某个年龄组在测验上的平均水平。不同的年龄组在同一测验上有不同的平均水平。由于文化背景的不同,心理特性的不同,不同的心理特性发展速度不同。年龄分组在不同测验上有差异,对用于年幼儿童的发育测验,年龄分组较细,几个月一个年龄组,而用于成年的人格和智力测验,往往几岁为一个年龄组。年幼儿童发育迅速,几个月后,心理就可能有质的飞跃,因此每几个月就要有一个常模。成年以后心理发育趋缓,几个年龄段之间差异不大,所以几个年龄段只要一个常模即可。
常模是心理测验计分和解释的参照标准。我们已经知道,心理测量的结果是一个相对分数,相对分数就是相对常模而言的。没有常模,当然就无法解释测验结果。只有知道了各自的平均水平,才能做出相对分数的比较。
除了上述提到的信度、效度和标准化外,标准化的心理测验工具在编制时,还有一个取样的代表性问题。也即行为样本的代表性和常模样本的代表性。按照测验的性质、目的,选择足以代表所要测定的心理特征或行为特征的测验问题。如:智力测验,选择符合智力结构,与智力活动有关的言语和操作为测验问题。通过这样的程序,保证行为样本的代表性。
用于计算常模的样本也应该有代表性。测验工具将用于什么样的人群,常模样本就应该取自什么样的人群。在抽样时,要考虑样本的年龄、性别、地区、民族、教育程度、职业等基本特征。样本具有代表性,测验结果才能更有效地说明问题。具有某一群体常模的测验,不能用于这一群体之外的对象。美国常模的人格测验就不能在中国直接使用,要想此测验在中国能使用,必须在中国抽取样本,取得中国常模,然后才能使用。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。