信度指的是一个测验的可靠性,即用同一测验多次测量同一团体所得结果之间的一致性程度。信度是衡量测验的测量可靠性指标。
信度的估算方法至少有四种,包括重测信度、复本信度、分半信度、同质性信度。
1.重测信度
重测信度指的是同一量表(测验或评价表)对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。重测信度有个基本假设,那就是假设某测验所要测量的潜在特质,短期内不会随着时间推移而改变。因此,重测信度的服务体系也在于估计测验结果(以测验分数表示)经过一段时间后是否仍然维持稳定、一致的特性,所以又称为稳定性系数。
现实中,人类潜在特质是会随时间推移而发生改变的,因此重测信度的高低与两次测量时间间隔长短有密切关系。一般而言,时间间隔越长,信度越低;时间间隔越短,则信度越高。任何一个测验由于重测时间间隔的不同,都可能有多个重测信度系数。两次测量的时间间隔一般来说,最合适的是被试的遗忘和练习的效果基本上相互抵消的时间间隔。
2.复本信度
所谓复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度。这两个测验在课题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又不相同的测验,故称作复本测验,有时也称作平行测验(parallel forms test)。复本信度的大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。
复本测验有两种方式:一是在同一时间连续施测,这种方法可以反映出测验内容造成的误差的多少,也就是说可以反映出两个测验是不是真正的平行测验,这种复本信度称作等值性系数(coefficient of equivalence)。二是间隔一段时间后施测,这不仅反映出测验内容的抽样误差,而且也反映了被试本身状况的改变,这种同时兼顾试题抽样与时间影响的信度,称作等值稳定性系数(coefficient of stability and equivalence)。与其他的信度系数相比,等值稳定性自然数最小,这种复本信度是对信度最严格的检验。
3.分半信度
分半信度是指将一个测验分成对等两半后,所有被试在这两半上所得分数的一致性程度。如果把对等的两半测验看成是在最短时间内施测的两个平行测验,也可以将分半信度和等值性系数一样解释。分半信度计算的是两个“半测验”上得分的相关系数,只是半个测验的信度,还必须用斯皮尔曼-布朗公式加以校正:
rxx=2rhh/(1+rhh) (公式6-1)(www.xing528.com)
公式中,rxx为整个测验的信度系数,rhh为两个“半测验”得分的相关系数。“斯皮尔曼-布朗”公式有个基本假设,那就是两半测验的变异数必须相等(即方差齐性)。
分半信度通常是在只能施测一次或没有复本的情况使用。测验分成相等的两半的方法很多,如按题号的奇偶分半、按题目的难度分半、按题目的内容分半等等。因此,同一个测验通常会因为分半方式不同而产生多个分半信度值。在实际中一般是采用奇偶分半并使两半测验的题目在难度上基本相等。
4.同质性信度
同质性信度也叫内部一致性信度,它是指测验内部所有题目间的一致性程度,包括两层意思:一是所有题目测的是同一种心理特质;二是指所有题目得分之间都具有较高的正相关。同质性信度就是指一个测验所测或特质的相同程度。
分半信度反映的是测验内部两半题目间的一致性,也可看作属于同质性信度。
同质性信度的假设:当一个测验具有较高的同质性信度时,说明测验主要测的是某个单一心理特质,由于众多的题目测试同一特质,实测结果就应该是该特质水平的反映。例如,用一道选择题测量被试某一能力,偶然影响太大,不能反映被试的真正水平,如果用更多的题来测被试的这一能力,这些题如果是测量同一能力的话,随着题量增多,必然会更加客观地反映被试的真实能力。
一个测验同质性信度不高,说明测验结果可能是几种心理特质的综合反映。这时对测验结果的解释,一种办法是将测验分解成多个各具同质性的分测验,再根据被试在分测验上的得分做出具体心理特质的解释。这样会造成测量每个心理特质的分测验题量减少,异质测验不适合使用同质性信度。如果测验反应速度是测验的重要因素,也不宜使用同质性信度系数。同质性信度估计的方法常用的是克龙巴赫(cronbach)α系数。
当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫α系数。这个公式可以处理任何测验的内部一致性系数的计算问题。其计算公式为:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。