二、实验研究法的基本理论
1.实验研究法的基本原理
社会科学研究中运用实验研究的目的,是为了建立或验证社会现象的存在和发生与所受客观影响因素之间的因果关系。在实验活动进行之前,人们一般会有预设性的对社会现象中因果关系的初步认识或假设。而实验法的功能,就在于通过实验研究,对这些预设性认识进行检验。因此,实验研究的基本原理是:实验者假定某些自变量会导致某些因变量的变化,并以验证这种因果关系假设作为实验的主要目标。在实验开始时,先对因变量进行测量(前测),再引入自变量实施激发,然后选择其后的某一个时点对因变量进行再测(后测),比较前后两次测量的结果就可以对原理论假设完全证实或部分证实或证伪。
以一个关于人的行为结果的实验为例。研究者的假设是:人们对他人的行为的期望可导致他人向期望的方向改变。由此他们提出的具体实验假设是:在学校里,那些被老师认为成绩应该好的学生,会由于教师的这种期望而在实际上变得比其他的学生提高的更快。研究者选择一所学校为实验室,让几百名学生参加智力测验,然后从中随机抽取了20%的学生,并且告诉教师说,这些学生的成绩是最高的,具有培养前途的。一年后,他们又对这几百名学生进行了测验。统计分析表明,上述20%的学生平均成绩明显高于其余学生。实验结果证明了先前的实验假设,即教师的期望和学生的学习成绩提高之间存在着因果关系。
上述例子说明了实验研究法的基本原理及其逻辑设置。首先以一个理论假设为起点,这个假设是一种因果关系的陈述,它假定某些自变量会导致某些因变量的变化。然后进行如下操作:
(1)在实验开始时对因变量进行测试(前测)。
(2)引入自变量(X),让它发挥作用或影响。
(3)在实验结束前再测量因变量(后测)。
(4)比较前测与后测的差异值就可以检验假设。
实验研究的原理逻辑可以用图10-1表示:
图10-1 实验研究法的基本逻辑
通过以上操作,如果前测和后测之间没有差异,就说明自变量对因变量没有影响,从而推翻了假设。如果有差异,即自变量对因变量有影响。
事实上,由于社会现象形成和发生的复杂性,一般来说,社会现象的实验研究中,后测得到的因变量不会只受到设定的自变量影响,往往还会受到其他因素的影响。因此,仅靠一个实验组可能会导致错误的因果关系描述。为了排除其他因素影响,解决实验结果的错误或误差,通常将受试者分为两个组:实验组和控制组。这两个组是随机选派的,它们的所有特征和条件都相同,只不过在实验中,实验组受到自变量的影响;而控制组则未受到这种影响。如此分开实验后,如果两组都有差异,且差异相同,则说明自变量对因变量没有影响;如果两组都有差异,且差异不同,则说明自变量和“实验”本身都对因变量产生了影响;如果两组都没有差异,则说明实验本身和自变量对因变量都没有影响;如果引进变量组有差异,未引进变量组没有差异,则可以说明是自变量导致了因变量的变化。
社会科学研究的目的,是为了找出社会现象的形成和发生中的某些因果关系,反映社会事物或现象的客观真实情况,揭示其内在规律。实验研究法的基本原理,就是基于如此目的而进行的总体逻辑设置。但落实到某项具体的实验研究,可能会由于重大事件、对象的发育成长、前测后测的具体环境变化、初试—复试效应以及对象选择或缺损等因素的影响,而使得实验研究结论有失正确性。
比如,重大事件影响就有可能。实验研究一般是对研究对象在实验刺激前后的态度、观念、价值、行为等进行测量,由于前测和后测之间经常会相隔较长一段时间,或是一周、或是一月,甚至一年半载。因此,出现在前测和后测结果的差异,除了实验刺激所造成的影响外,还有可能受到发生在实测时间段中的某些重大事件所造成的影响。假如美国轰炸我国驻南斯拉夫大使馆这一重大事件,刚好发生在我们进行一项涉及大学生对世界上一些发达国家的认识和态度实验的过程中。那么,在实验后测中,实验对象对美国的看法和认识上的得分显然会受到这一重大时间的影响。用实验的语言来说,就是除了原来设计的实验刺激外,重大事件也就成了一个新的“实验刺激”。如图10-2:
图10-2 重大事件影响实验研究结果
这种情况启示我们,在出现某些与实验内容关系密切的重大事件时,实验对象呈现的前后变化,不一定全部由预定的实验刺激的作用所致,也即因变量的变化不一定全部由自变量所引起,很可能是自变量和其他因素共同作用而成。
2.实验研究法的要素
实验研究方法涉及的要素主要有:假设、变量、实验组与控制组、前测与后测、实验处理与实验变异。
(1)假设。当研究的问题一旦被明确界定后,就应建立研究假设。所谓研究假设,即根据自身所掌握的一定观察事实和科学知识,对研究的问题提出假定性的看法和说明。比如在某典型的办公室中,我们想研究四日工作周对办公室的效率产生的影响,可作如下假设:引入四日工作周将提高办公室的工时效率。
(2)变量。变量是研究设计初期就要考虑的问题。根据变量发挥的不同作用,可以分为自变量与因变量、缓变量、中介变量、外源变量等。
变量的种类有很多,常见的有自变量和因变量。社会科学研究中的自变量和因变量这两个名词是从数学引用过来的。在数学中,y=f(z)这一方程式中的z是自变量,y是因变量。因变量是随着自变量的改变而改变的。例如,指示剂颜色的变化是随着溶液的酸碱性的变化而变化;当溶液至酸性时,酚酞指示剂呈无色;当溶液呈碱性时,酚酞指示剂呈红色。因此溶液的酸碱性是自变量,而酚指示剂的颜色变化是因变量。在社会科学研究中,自变量常常是一个分类变量。例如,研究者要研究不同教学方法对学习成绩的影响,必须先采用不同的教学方法进行教学,然后再测量比较学生的学习成绩的改变。在此例中,不同的教学方法是自变量,而学生的学习成绩就是因变量。自变量是居于因的地位,因变量是居于果的地位。
自变量是另一变量变化的原因,因变量是自变量作用的结果,通常自变量是实验中的刺激因素,它们是最重要的两种变量。实验研究的基本内容就是检验自变量对因变量的影响,一般可以直接或间接在实验中观察。比如在一个关于测量种族歧视的实验中,以对黑人的偏见为因变量,而面对黑人历史则是自变量。研究者的假设认为,偏见在一定程度上依赖于人们对黑人历史的了解,实验的目的就在检验这个假设的准确度。适合于实验的自变量和因变量非常多,并且在不同的实验中自变量和因变量可以相互转化。上述例子中的偏见就是因变量,而在研究偏见对人们投票行为的影响时,它又成了自变量。实验中,自变量和因变量都要根据实验目的进行操作化,这种操作化界定涉及大量的观察方法。例如,问卷调查结果就可以作为界定偏见的基础。与黑人受试者对话,赞同、反对或忽视黑人的评论,都可以作为在小群体情境中,对与黑人互动进行操作化定义的基本要素。当然,无论如何,实验法和其他定量方法一样,需要具体与标准化的测量和多方观察。
在实际研究中,很少有这种简单的“自变量——因变量”的一对一关系,通常还要考虑其他变量。缓冲变量实际上也是一种自变量,它会对原来设定的关系产生重要影响。在上述子例中,年轻员工可作为一个缓冲变量,从而研究假设可以表述为:引入四日工作周将提高办公室的工时效率,尤其是对年轻员工。
中介变量是自变量对因变量产生作用的媒介,它在理论上能对结果产生影响。但这种影响不能被直接观察、测量或操控,只能通过自变量和缓冲变量及对结果的影响推断出来。在上例中,工作满意度可作为中介变量,从而研究假设可进一步表述为:引入四日工作周将通过提高工作满意度来提高办公室的工时效率,尤其是对年轻员工。
外源变量是对研究系统产生影响的变量,它会对系统内部的变量关系产生显著影响。有些外源变量可作为自变量或缓冲变量来处理。但大多数必须进行假定或设法消除其对研究系统的影响,最常用的思路是在实验中对其进行控制。比如在上例中,常规办公室工作可作为外源变量的一个控制状态,从而研究假设可以表述为:在常规办公室工作中,引入四日工作周将通过提高工作满意度来提高办公室的工时效率,尤其是对年轻员工。
(3)实验组与控制组。在实验研究中,为了准确验证因变量的变化确实是由自变量引发的,我们通常把实验对象分为两组,其中把接受实验处理的一组研究对象称为实验组,并且实验组可能有多个;而不接受实验处理的一组研究对象称为控制组,控制组也可能有多个。实验结束时,比较实验组和控制组便可看出实验处理产生的差异,控制组提供了测量实验变异的参考点。实验组和控制组在实验过程中,全都处于同一条件下,只是实验组研究变量接受了实验处理。因变量在实验前后的变化应完全来自研究变量接受实验处理的结果,然而,要判断这种差异是否只来自实验处理,还必须比较实验组和控制组实验结束时的状态。与控制组有关的一个概念是控制变量。控制变量是指实验过程中其值保持不变的自变量。
罗茨里伯格和迪克森在20年代晚期和30年代早期所做的一系列关于员工满意度的研究,使控制组被纳入社会研究这一点变得更加突出。这两位研究者研究位于伊利偌州芝加哥市郊霍桑的西部电器厂“电话配线机房”的工作条件,他们试图发现改变工作条件会改善员工的满足感并提高生产力。结果令人大为满意,他们发现,工作条件的改善,使满足感和生产力都提高了。例如,车间照明条件的改善,生产力因而提高。照明条件进一步改善,生产力又随之提高。为了进一步证实其科学结论,研究者把灯光转暗,但生产力还是跟着提高!
显而易见的是,与其说配线机房工人因工作条件改善而工作得更好,不如说是研究者对他们的注意引起了他们的反应。这一现象通常称为“霍桑效应”,社会科学家对于实验本身的影响就更为敏感和小心了。在配线机房的研究中,采用一个合适的控制组——除了工作条件不变之外,也接受集中的研究——可以发现这种效应的存在。对于社会科学实验而言,控制组之所以重要,不仅在于防止实验本身的影响,而且在于排除实验进行过程中外在事件的影响。
(4)前测与后测。前测和后测分别是指在实验处理之前和之后对实验对象所作的观察或测量。它们可以使我们比较实验处理前后发生的情况,找出因变量发生的变异。但仅有前测和后测还不足以让我判断出实验变异有多大,因为因变量的变异可能包含部分外部变异。这就需要引入上述的控制组。前测和后测的方法很多,一般比较常用的是问卷调查,主要侧重于对实验对象的主观因素的测量。但是并非所有测量都局限于问卷调查。例如在对一个教师与学生的融合程度对学生学习成绩的影响的实验中,因变量是学生的学习成绩,前测就可以采用直接根据最近的考试成绩计算的方法,或者采用一个小测验的方法;后测就可以采取一个统一的测验方法。
(5)实验处理与实验变异。实验处理又称实验刺激,它是指研究者为了弄清自变量的变化对因变量的产生的效应,对自变量施加的控制行为。研究者关心实验处理所引起的因变量的变异,这种变异称为实验变异。问题在于因变量的变异不只是来自实验处理,测量误差的随机干扰以及未接受实验处理的其他自变量也是引起变异的因素。由于实验处理之外的因素引起的因变量变异称为外部变异。实验的难点,往往就在于如何消除外部变异而凸显实验变异,或者区分因变量的哪些变异属于实验变异,哪些属于外部变异。这需要引入上面要提到的控制变量和控制组来实现。
3.实验研究的程序
实验不同于一般的观察,它是在特定的条件下按照严格的程序进行的。因此,进行一项实验研究需要研究者做精心细致的准备工作。实验研究的程序一般如下:
(1)确定研究问题。这是一项研究活动的研究起点,不解决问题或无问题的研究,也就不能称之为一项真正的研究。一般作法是在有了初步的构想后,通过查阅文献和有关访谈,对初步构想的价值和可行性进行思考,最终明确研究问题、大致的内容范围和所要达到的目标。
(2)提出研究假设。实验研究中,假设是研究活动开展的基本条件之一,如果没有提出假设,研究就没有实验设计的依据,也就没有实验研究所需要证明或检验的目标。一般作法是仔细寻找出实验的主题和内容范围所涉及的各种变量,将它们分类,并认真分析它们之间的关系,建立各种变量之间的因果假设模型。
(3)设计实验方案,就是研究活动进程的计划方案。即将已确定的研究问题、理论假设、实验对象及实验方式等整理成文字,说明实验的时间安排、地点和场所、实验进程、实验和测量工具等,并形成系统的、条理分明的实验方案。
(4)选择研究工具,就是根据研究问题、目的选择适合实验研究的工具、场所、方法以及技术手段等。
(5)确定研究对象,也即确定研究活动的实验对象。选取对象的根据是实验的主题和变量间因果模型的需要,选取的方法既可以是随机抽样,也可以是主观指派或配对。
(6)进行实验观察,就是实验活动进行过程中具体掌握因变量的发展变化,记录变化数据等。这里主要包括几项工作:第一,前测。用一定的方法对实验对象的各种因变量做详细的测量,并做详细记录。如果是有对照组的实验,事先要做到能够控制实验环境和条件,以保证实验组与对照组的状态基本一致;第二,引入或改变自变量。对实验组进行实验激发。在激发的过程中,要仔细观察,认真作好观察记录;第三,后测。在经过一段时间后,选择适当时机对实验对象的各种因变量作再次详细测量,并做详细记录。
(7)整理分析资料,对实验所获得的第一手资料进行分析、厘清、统计,并对原假设进行检验,形成实验结果,据此提出理论解释和推断。
(8)撰写研究报告,对实验所获得的结果进行总结、归纳、概括。
上述的(1)、(2)、(3)、(4)环节,实质上是实验研究的准备阶段,包括查阅有关理论文献,确定研究课题的价值,以及选择实验场所,配备实验设备,准备测量工具,制定实验日程表,安排控制方式和观察方法技巧等;上述(5)、(6)环节,实质是实验研究的具体实施阶段,即进行实验测量操作的阶段,包括选取实验对象和进行实验两个步骤。选择受试者是实验研究中的抽样过程,对于实验结果具有重要影响。一般采取随机、指派等方法进行实验分组。本阶段是根据实验设计方案进行实验,控制实验环境,引入自变量,观察实验对象的变化,做好测量记录等。实验所要求的观察记录应当是定量化的数据,因为自变量的影响只能通过量化的指标才能加以评定;上述(7)、(8)环节,实质是实验研究的资料整理总结、形成研究成果或结论的阶段。此阶段既是对前面阶段的总结,也是对实验结果的陈述和表达,同时也是实验目的的体现。其一方面要整理汇总实验材料,并对观察记录进行统计、分析,得出实验结果,以此检验假设,提出理论解释和推论;另一方面就是具体撰写研究报告,根据实验结果和前期的文献资料撰写研究报告,研究报告实验研究的最终成果。
如果将实验研究的上述基本程序再细化,则其可以分解成如下步骤:(www.xing528.com)
(1)从一个有关因果关系的简单明白的假设开始;
(2)根据实际条件决定一种合适的实验设计用来检验假设;
(3)决定如何引入实验刺激或如何创造一种引入自变量的背景;
(4)制定一种有效的和可信的因变量的测量;
(5)建立实验背景,并对实验刺激和因变量测量进行预实验;
(6)选取合适的实验对象或个案;
(7)随机指派实验对象到不同的组,并对他们进行详细指导;
(8)对所有组中的个案进行因变量的前测;
(9)对实验组进行实验刺激;
(10)对所有组中的个案进行因变量的后测;
(11)告诉实验对象有关实验的真实目的和原因,询问他们的实际感受;
(12)考察所收集的资料,进行不同组之间的比较,并运用统计方法决定假设是否被证实,同时撰写研究报告。
对于实验研究的上述基本程序,不同的课题实验,在具体研究程序或步骤上,并不是一成不变的,可以根据具体问题、具体情境及具体目的作适当的调整。
4.实验研究对象的选择
实验研究对象实质是受试者的选择问题,其关系到实验的效度和信度问题。因此,选择研究对象是实验研究中的关键一环,不可忽视。一般而言,选择研究对象所依据的原则有两个。第一个是“概化”原则,即实验所选择的对象一定要代表所要研究的大众群体。而实际情况是,实验所招聘的受试者往往具有局限性,例如报酬问题,是否愿意参加受试的问题等等。鉴于此,实验的受试者大多数是那些“易得”群体,像大学生志愿者等,这些受试者有时候并不能完全代表实验所要研究的对象。这实质上反映了社会科学研究中的一种潜在的缺陷。第二个是“相似”原则。即研究的实验组和控制组应当尽可能地做到相同或者相似。因为实验的一个重要原则是实验组和控制组具有可比性,而这种可比性是以实验前的相似性为基础的。理想的状态是,控制组应该等同于未面对实验刺激的实验组,因此,选择受试者过程中的各种方法都应该尽量体现这种原则。
在实验中,为了体现上述“概化”及“相似”原则,理论上看,一般可以采取概率抽样的方法选择受试者,概率抽样的逻辑与技术可以提供选择两组相似人群的方法。大致的操作是,先把所有的研究对象作为抽样框,再从中抽取两组样本,如果两组随机样本各自与总体相似,则可以体现相似性。然而,这种抽样方法在社会科学研究的实验中有时很难真正采用实施,因为社会科学研究中过少的样本不具备足够的代表性,但是为了保证实验的代表性和准确性,随机抽样的逻辑还是被应用与一些经过改进的方式中。为了比较实验组和控制组的状态并确定研究变量产生的影响,两组的组成要素必须尽可能类似,否则,实验结果将是一种混合效应,无法说明问题。为了避免这类问题,使实验组和控制组的组成要素(样本)具有相同的条件,主要采用随机法和配对法两种方式:
(1)随机法
随机法,即完全按照随机抽样的原则,将研究对象分派到实验组和控制组中,也可用随机数表。随机法是最常用的分组方法,在理论上也是最有效地控制影响变量的方法。这样,在大样本情况下,按照随机抽样的原则,各个组的实验对象的构成、条件基本相同,外部因素对其影响也是等同。即使会出现一些误差,也只可能是抽样误差,而不是系统误差,从而使实验结果凸显出实验处理的效果。随机法无须对研究对象的各种属性进行研究,应用方便,成为最常用的方法。但随机法和概率抽样是不相同的。例如,实验者通过报纸广告招募到了40名受试者,我们没有理由相信,40名受试者一定代表其所抽取的母群体,因此也不能预设20名随机分配到实验组的受试者能代表更大的总体,然而,我们可以确信,20名随机分到实验组的受试者与随机分配到控制组的20名受试者相类似。随机法的基本操作方法大致有:抛硬币法、单双号法、排列抽取等方法。
(2)配对法
配对是指对研究对象分组时,先找出具有相同属性的两个研究对象,将其中一个分派到实验组,另一个分派到控制组,然后以同样的方法一对一对地指派,直至形成两个组。在心理学的实验中,这种方法比较常见。这样形成的两个组在理论上是完全相同的,但在实践中却很难做到,因为不可能存在两个完全相同的研究对象。例如,两个人的文化程度、年龄和性别都相同,但是他们的家庭出身、性格习惯等方面可能存在很大的差异。社会科学研究中的实验法,在检验因果关系假设的过程中往往关注自变量的影响,实际上除自变量以外,其他未知的因素对因变量同样具有影响作用。所以,如果要做到实验结果的高度准确,就必须保证配对样本各个方面的同质性。但是在现实生活中,要想寻找两个或多个各种条件都相同的样本几乎是不可能的。为了克服这种困难,可采用不太严格的配对法,使两个组在各种特征上的比例大致相同;或者在某一主要影响变量的分布和方差上大致相同。尽管如此,它们不能消除其他未控制因素的影响,因此,配对法往往结合随机法一起使用,而很少单独使用。另外,如果制作一个由所有最相关特征组成的配额矩阵,全部配对工作可望高效地完成。理想上,这样的配额矩阵中应该让每一个格的受试者都为偶数,即每一格受试者的一半进入实验组,另一半则进入控制组。下图就是一个配对矩阵实例:
图10-3 配对矩阵实例
配对法在实施中还面临着另外几个困难:一是所考虑的因素不能过多,否则往往难以实施;二是实验前并不知道研究对象的何种变量将影响实验结果,研究者只能在他们已经意识到对因变量可能有影响的变量上进行匹配;三是现实中往往没有足够的对象供我们选择;四是人们的有些特征在实践中是很难测量的,很难操作化为具体的指标。
5.实验研究的信度与效度
如何评价一个实验?对这个问题的回答涉及两方面的内容:其一,实验是否明确、有效、可操作;其二,实验是否可重复、可验证。这其实就是实验研究的效度和信度问题。效度就是实验结果的准确性和有效性程度,信度就是实验结果的可靠性和前后一致性程度。效度和信度是实验研究成败的关键,也是对任何实验进行评价的指标。
(1)实验研究的信度
实验研究的信度,指的是实验方法与实验结论的可靠性。实验结果的可靠性可以简单归结为:如果再重复实验,其结果会与第一次相同吗?与其他方法相比,实验法的信度较高,但在实验过程中,仍有许多因素会导致实验误差,影响实验的信度。如何克服这种现象,使实验真正发挥其优势作用,是实验者需要解决的一个重要问题。
影响或决定实验信度的一个关键因素是观察量。观察量越大,我们就越有理由相信样本统计值接近总体参数值,也即是样本更能够代表其所在的总体。例如,在我国随机抽取一个样本进行问卷调查,调查的内容是关于他们对即将实施的某项政策的态度,我们相信样本容量为10万人要比样本容量只有100人更能准确地反映出全国民众的意愿。同样,如果一个研究者想对中国大学生的心理健康状况进行调查的话,他需要做的是在中国的各个地区随机选取所需要的大学生样本,而不是仅局限于他所在的城市。因此必须牢记,研究中某一特定结果的信度取决于产生这一结果的观察量。在实际研究中,我们一般尽量使观察量增加到最大限度。这样做不仅可以提高结果的信度,而且增强了我们所使用的统计检验的效力,或者说增强了拒绝虚无假设的检验能力,也就是说使我们更能够确信自变量对因变量存在影响。
同时,实验信度还涉及对结果的统计检验。在任何实验中,当得出结果时,我们首先会问它是真的吗?这就又将我们带回到了信度的问题中,即:如果再做一遍实验,还会得到与之相同的结果吗?回答这个问题的一个方法就是计算推断统计的结果。简单地说,推断统计用来确定两种实验条件下的差别到底是由自变量还是随机因素造成的,如果不同实验条件下所得出的结果之间差异很大,而且这种差异由偶然因素造成的概率低于5%时,那么就可以排除偶然因素造成实验结果的可能性,认为该结果是由自变量造成的,根据统计检验所得出的差异是具有统计信度的。统计信度是得出实验结果的必要条件,但更多的研究者倾向于实验同时还具有实验信度。因为,尽管结果具有了统计信度,但其中仍有5%的犯错误的概率,也就是仍然存在着偶然因素会混淆实验结果的可能性,而且即使实验控制得很好,这种问题也会发生。
提高实验的信度,除了要采用前述各种方法努力排除非实验因素的干扰之外,还应注意测量工具的标准化和精确度问题。例如,实验法在测量已明确定义的行为及其类型时,实验的信度较高。但当采用问卷或量表测量人们的态度时,则可能由于所设问题的语义不清而使信度降低。因此在设计问卷、量表等测量工具时,一定要反复推敲,使之达到较高的标准化程度与精确程度,这样才能保证实验结果的准确无误。对信度的检验一般是采取重复实验的方法,如果发现几次实验的结果有较大的差异,则很可能是测量工具存在问题。另外还可以采用多组实验设计的方法,通过各个组在同一实验中的差异来检验信度。
(2)实验研究的效度
实验效度是指实验方法能达到实验目的的程度,也就是实验结果的准确性和有效性程度。实验效度主要包括内部效度和外部效度。
①内部效度。实验的内部效度是指实验中的自变量与因变量之间因果关系的明确程度。如果在实验中,当自变量发生变化时因变量随之发生改变,而自变量恒定时因变量则不发生变化,也就是说确实是自变量而不是其他因素引起了因变量的变化,那么这个实验就具有较高的内部效度。由此可知,内部效度与无关变量的控制有关。当实验中未得到控制的无关变量越多时,因变量的变化不是由自变量引起的可能性就越大,实验的内部效度就越低。当实验结果未受到任何其他变量的干扰,自变量与因变量的因果关系明确时,实验的内部效度就是高的。
例如,某研究者想考查单词的音节数与学习难易程度之间的关系,他在实验中选取了1、2和3三个音节(三个水平的自变量)的单词让被试者进行学习,并以正确回忆率作为因变量指标。他发现被试者学习的单词音节数越多,正确回忆率越低,于是得出结论,认为单词的音节数是导致学习难易程度的因素。在这个例子中,实验者忽略了重要的无关变量──音节短的单词使用的频率高,而单词使用频率在实验中没有得到有效控制。因此,我们认为该实验的内部效度不高,其研究结果未必有效。内部效度的影响因素很多,大致情形如下表所示:
表10-2 内在效度的影响因素
续表:
②外部效度。实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性。普遍性的问题在所有类型的研究中都存在,也是研究者感兴趣的问题。它涉及实验结果的概括力和外推力,也就是实验结果接近现实的程度。实验的外部有效性,使得我们可以将实验中的因果关系应用到更大范围和更现实的场合中,这正是我们的目的所在。一般而言,现场实验比实验室实验有更高的外部有效性。
对于任何一个实验结果来说,最为关键的问题是当超出产生该结果的实验条件之外它仍会存在的普遍性问题。詹金斯(1979年)的记忆实验四面体模型向我们提供了四个评价这种普遍性的维度:第一,用其他的被试人群也能得到同样的结果吗?第二,用其他的实验材料也能得到同样的结果吗?第三,用其他不同类型的测验会出现同样的结果吗?第四,用不同的实验处理和不同的自变量操作方式也能出现同样的结果吗?概括地讲,也就是一个特定的结果能否从诸如被试人群、材料、情景以及因变量的测量等几个方面推广出去。对所有这些问题的回答,其实就是研究的外部效度问题。
提高实验的效度,要从实验的外在效度和内在效度两方面着手。提高实验的外在效度,主要就是必须保证所选取实验对象的代表性。例如,进行企业股份制实验,如果是要检验优质企业实行股份制的效果,就必须选择利税大户作为实验对象;如果是要检验劣质企业实行股份制的效果,则必须选择濒临破产的企业。这样,实验的结论才有普遍应用意义。提高实验的内在效度,涉及的问题比较多。笼统地说,前述所有控制引入自变量和无关变量的方法都是提高实验的内在效度的重要方法。此外,选择恰当的测量方法和测量工具、选用精确度高的测量仪器等,也是必需的方法。还有一点也非常重要,就是实验者的工作态度一定要认真细致,否则会对实验效果造成意外的不良影响。
在提高实验效度的问题上,有一个目前无法彻底解决的难题:实验的外在效度和内在效度是一对矛盾。要精确测量自变量的影响就要严格控制实验过程,但这种控制达于极致就会使实验环境人工化,即成为实验室,而实验室实验往往缺乏代表性,从而降低实验的外在效度;要使实验能概括广泛的现象,就要让实验对象存在于真实的社会环境之中,但这就很难控制各种外部因素的影响,从而降低实验的内在效度。大部分实验设计都面临着这种两难处境:提高内在效度则有可能降低外在效度,反之亦然。因此,把实验的外在效度和内在效度同时提高到顶点基本上是不可能的,实验者能够做到的,只能是在二者之间寻求平衡点,使实验的效度达到可能的最佳点。
综上所述,当实验中需要控制的自变量及其他因素较多,就不得不选择做实验室实验,以保证实验的内部有效性。否则,我们可以选择现场实验,以保证实验的外部有效性。当然,实验研究的效度和信度从来都不是相互割裂的:一个具有良好效度的实验,将得益于其对变量关系的明确把握,因而其结论往往也具备高度的可重复性;反过来,一个信度高的实验,则需要在保持其可重复验证优点的同时,设法提高其结论的推广价值。良好的效度和信度是评价实验设计成功与否的关键,而雄厚的理论基础、周密的思考和设计、谨慎科学的态度则是达到实验效度和信度的必备素质。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。