第二节 合格心理测量的特征
一、中国民间的前科学形态的心理测量活动
1.手相
所谓看“手相”,又称万相之首,指一些中国民间术士通过手掌上常见的一般线与纹,根据一定的规则,赋予它们相应的意义。换句话说,就是根据你手上的纹路来判断你的命运、前途、事业、婚姻、健康状况等人生重大事情和预测吉凶祸福。看手相的人就是根据这五条主要线纹的连续或断开、长或短、多或少、有没有分叉这些情况,来预知你会活到多少年纪,有几次婚姻,事业是否顺利等。
2.面相
所谓的“面相”,就是通过观看一个人“面部特征”的方式来论命。有一句话说“相由心生”,这句话主要就是说一个人的个性、心思和为人善恶,可以由他的面相看出来。面相学与手相学有异曲同工之妙。手相学是根据手上纹路的状况来推断某人的健康、事业和婚姻。面相学是根据脸部的宽窄肥瘦,眼、耳、口、鼻,乃至痣的位置、比例等情况来推断一个人的性格和命运。
3.占卜
所谓的“占卜”,就是指用各种超尘世的方法来获得尘世间事物的信息或预卜凶吉祸福的活动。“占”意为观察,“卜”是以火灼龟壳,认为就其出现的裂纹形状,可以预测吉凶福祸。它通过研究观察各种征兆所得到的不完全的依据来判断未知事物或预测将来。
二、衡量测量工具科学性的标准
我们在选择一个心理测验量表来度量人的心理水平时,经常会考虑这样一些问题:用这种工具测得的结果准确吗?每次所测得的结果都一致吗?测验结果的一致性和准确性,即测验的可靠性和有效性,是任何一个良好的测量工具都必须保证的前提,这在测量学上称为信度和效度。心理测量中通常用于衡量测量工具是否具有科学性的技术指标有信度、效度、难度、区分度和常模。
(一)信度与效度
1.信度
信度即测验的可靠性,是指同一组被试在不同的时间内用相同或等值的测验多次测量结果的一致性程度。一个好的测量工具,对同一事物反复多次测量,或由不同的人使用,其测量结果应该保持不变。一个测验究竟信度多高才合适、才让人满意呢?最理想的情况是信度系数R=1.00,但实际上是无法实现的。根据多年的研究结果,一般的能力测验和成就测验的信度系数都在0.90以上,有的可以达0.95;而人格测验、兴趣、态度、价值观等测验的信度一般在0.80~0.85或更高一些。一般原则是:当R<0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70≤R<0.85时,可用于团体比较;当R≥0.85时,才能用来鉴别或预测个人成绩或作为。另一原则是新编的测验信度应高于原有的同类测验或相似测验。
2.效度
效度是指测量的有效性,即一个测验对它所要测量的特性准确测量的程度。一个测验总是为一定的测量目的而设计编制的,并具有一定的操作规则和使用范围,判断它的效度高低,首先要看它达到测验目的的程度,如果能正确地测量出所要测的东西,那么它就是高效度的测量。考察效度的方法很多,每种方法侧重点不同,名称也随之而异。效度可分为三大类:内容效度、构想效度和效标关联效度。
3.信度与效度的关系
信度是效度的必要而非充分条件,效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必要条件,并不是效度高的充分条件。
效度是受信度制约的,信度系数与效度系数之间还有这样的关系:信度系数的平方根是效度系数的最高限度。一个测验与外在效标的相关,不会超过与它自身相关的平方根,也就是一个测验的效度不会超过它的信度的平方根。这说明,一个测验的效度总是受它的信度所制约。
(二)难度和区分度
1.项目难度
项目难度是对被试完成项目作答任务时所表现出来的困难程度,关于测验项目困难程度的计算方法可以分为两种不同的情况,当项目是客观题(即二级记分)时,难度系数就等于通过率;当项目是主观题(即多级记分)时,难度系数就等于所有受测者在项目上的平均分除以总分的商。进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质及项目的形式。大多数的标准测验,都希望能准确测量个体的差异。如果在某题上,被试全答对或全答错,则该题无法提供个别差异的信息,也不会影响测验分数的分布,因此对测验的信度和效度没有多大的作用。P值越接近于0或接近于1,越无法区分被试者之间能力的差异。相反,P值越接近于0.50,区别力越高。
由于人的心理特性基本上是呈常态分布的,而我们目前所采用的统计方法又大都以正态分布为前提,因此大多数测验在设计时希望分数呈现常态分布的模型。如果被试样本具有代表性,对于中等难度的测验,其测验总分应该接近常态分配。(www.xing528.com)
2.项目区分度
项目区分度又称为项目鉴别力。它是指项目(题目)对不同水平的被试反应的区分程度和鉴别能力。若项目鉴别力高,则能力强、水平高的被试得分高,能力弱、水平低的被试得分低,否则就没有鉴别力。
图7-1 难度与区分度的关系图
项目鉴别指数是计算鉴别力时最常用,也是最简单的方法。被试按总分高低排列,然后取得分最高的27%的被试作为高分组,得分最低的27%的被试作为低分组。计算高分组该题答对的人数比率与低分组该题答对的人数比率,采用公式:D=PH-PL。D值越大,项目的鉴别力越强,表示项目的质量越好。
如果以项目的难度作为横坐标,以项目的区分度作为纵坐标,则难度与区分度呈倒U形关系,如图7-1所示。
我们知道,难度和区分度都是相对的,是针对一定团体而言的,绝对的难度和区分度是不存在的。一般来说,较难的题目对高水平的被试区分度高,较容易的题目对低水平的被试区分度高。由于人的心理特性的分布呈现常态,所以项目难度的分布也以常态分布为好。
(三)常模
常模就是解释测验结果的一套参照指标,由样本总体测量结果的统计平均值表示。参加测验的每一个人所得原始分都要与常模团体相比较才能做出解释。所谓统计平均值,是指为了表示一组数据的规律性,需要计算出一些能够反映这组数据的统计特征的数字,把它们称为统计平均值。最常用的统计平均值是平均数和标准差。
1.常模团体与常模分数
常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个有代表性的样本。它用一个标准的、规范的分数表示出来,为个体在心理测验中所获得的原始分数提供了一个比较的基础或参照的标准。
常模分数就是对常模团体进行测验以后,将被试的原始分数按照一定的规则转换出来的导出分数。常模分数所构成的分布,就是通常所说的常模,它是解释心理测验分数的基础。最常见的常模主要有三种:发展常模、标准分数常模和百分位常模。
2.发展常模
人的许多心理特质如智力、技能等,是随着时间以有规律的方式发展的,所以可以将个人的成绩与各种发展水平的人的平均表现相比较。根据这种平均表现所制成的量表就是发展常模,也叫做年龄常模。最直观的一个发展常模就是葛塞尔的发展程序表。它可以告诉人们多大的儿童具备什么能力或行为就表明他发育正常,相应行为或能力如果早于某年龄出现,说明发育超前,否则即为发育滞后。在这种量表中,个人的分数指出他的行为在按照正常途径发展方面处于什么样的发展水平。
3.百分等级常模
百分等级粗略地说,某一原始分数的百分等级可以解释为常模团体中得分低于这个分数的人数的百分比。换句话说,百分等级指出的是个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低。
4.标准分数常模
标准分数确定的依据是根据测验分数正态分布的性质,它是在原始分数的基础上按照一定的规则转化过来的,它反映了原始分数在分数总体中的相对位置。标准分数Z是原始分数与平均数的距离以标准差为单位的分数,用公式表示,则为:
Z=(X-M)/S
其中,X为原始分数;M为总体平均分数;S为总体标准差。常见的转化以后的标准分数有:Z分数、T分数、标准九分分数、离差智商等。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。