三、实验研究的类型及设计
1.实验研究的类型
实验研究根据划分标准的不同可以分为不同的类型。例如,根据实验设计的不同,可以分为标准实验和非标准实验;根据实验场所的不同,可以分为实验室实验和实地实验;根据社会科学的特殊研究需要而创造的双盲实验。
(1)标准实验和非标准实验
标准实验和非标准实验是针对实验的规范程度以及对实验条件的控制能力而作的区分。一个完备的标准实验应当具有以下要素:两个或多个相同的组;前测和后测;封闭的实验环境;实验刺激的控制和操纵等。一般地说,具备这些因素的实验称作为标准实验。基于社会科学性质、对象、内容等方面特点,要设计建立一个标准的社会科学实验是比较困难的。因此,严格的实验设计在现实社会中并不具有实际应用价值。
顾名思义,非标准实验指的是并不具备标准实验所要求的所有条件,为了研究的需要而进行的必要的省略或者特殊设计的实验。例如在社会科学实验设计中常用的单次研究设计、单组前后测设计、静态组间比较等实验方法都属于非标准实验,但是这些实验方法对于不同性质的实验能够发挥各自不同的作用。
标准实验和非标准实验代表着实验规范程度的两个极端,在实际的实验研究中,完全的标准与非标准都是很难做到的。标准实验往往体现出某种弹性(尤其在社会科学实验中),非标准实验必然以标准实验为依据,在设计和操作上向标准实验靠拢,因而有时也将其称为“准实验”,是类似于、接近于的意思。具体的实验中是倾向于标准实验还是倾向于非标准实验,完全取决于研究的性质、研究的目的和研究的精度要求。实验设计是在成本和收益之间做出的最佳选择。
(2)实验室实验与实地实验
人们一般认为,实验是在实验室中进行的,这是从自然科学的实验中得出的常规思维定式。由于自然物自身的特点,实验并不受场所变化的影响,在实验室中对于物质活动规律的认识完全反映了物质的本质属性,可以应用到实践当中去。由于实验室中可以进行比较好的条件控制,可以集中配置所需要的实验设备,所以科学实验基本都是在实验室中进行的。而社会科学却不同,社会科学研究的对象是人,由于人是具有实践能动性的主体,所以场所的变化以及所研究的人对于事件的认识和感知都会影响到他们的行为。有鉴于此,实验室内的实验对于社会科学研究来说就有许多致命的局限性,需要引进一种能够排除实验设置对研究对象的影响的实验场所,实地实验便是其一。
实验室实验和实地实验都各有其优点和缺点。在实验室实验中,实验背景的变量都相对容易控制,实验环境比较封闭,受外界因素的干扰较少,实验者能够比较清楚地观察到自变量对因变量的影响,这是其主要的优点。但是在实验室中可以进行的实验内容有局限性,许多社会科学研究者需要研究的内容无法在一个小小的实验室中复制出来。在实地研究中,研究者可以在一个很自然的环境中观察、测量人们的真实反应,其优点是真实、自然,效度较高。缺点是实地实验难以对众多的有可能影响因变量的实验背景、实验条件进行控制,难以孤立出自变量的独立影响。它所做的主要工作是观察发生了的事情。例如,在一个研究文化程度与人们的文明礼貌行为的关系的实验中,实验室实验几乎无法做到,我们采用实地实验的方法,比如研究者在公交车中进行观察,见到那些主动起身给老弱病残让座的乘客,要知道他们的文化程度就比较困难,此时他们可以采用观察分析的方法,或者直接询问的方法(难度较大),这必然夹杂着研究者的主观认知成分。
(3)双盲实验
所谓双盲实验,是指在一项实验中,实验刺激对于实验对象和参与实验的观察人员来说都是未知的。即究竟是实验组还是控制组被给予了实验刺激,参与实验的双方都不知道,实验刺激是由实验人员和实验对象以外的第三者任意分派和给定的。
双盲实验的发源是“主试效应”和“被试效应”。所谓“主试效应”,是指“由于实验者对研究结果的期望而产生的实验偏差”。主试效应常常被称为“皮格马利翁效应”,传说塞浦路斯国王皮格马利翁在雕塑一座少女像时十分地钟情于她,竟然使得雕像获得生命变成了真实的少女而与他结为伴侣。心理学家罗森塔尔曾经用实验的方法证实了教育中期望效应的作用,由此,主试效应又被称为“罗森塔尔效应”。所谓“被试效应”是指“由于实验对象对其被试身份的认知及态度而产生的实验偏差”。被试效应又被称为“霍桑效应”(2)。例如在一个教育实验中,研究者需要研究社会的认同与学生的表现之间的关系。在实验当中必须排除“被试效应”,指那些针对“被试身份”而并不是针对实验处理的“心理作用”。诸如“实验班”的孩子因为不断地有人来观摩油然而生的自豪感及亢进的表现,就是典型的“被试效应”,因为被试的如此反应主要是由“实验场面”造成的,与实验处理之间并没有因果的联系。
另一方面,在实验中主试与被试不可避免地会发生有意识的“心理互动”,甚至有时“教师对儿童的期望”本身就是一种实验处理。在如上所述的教育评价实验中,孩子们对不同的实验处理(老师对自己的评价方式)当然会有不同的心理感受,进而还会影响到孩子的行为。这种行为变化恰恰是实验处理的结果,是实验研究的内容。这既不是实验中必须排除的“被试效应”,也不是歪曲了实验事实的“主试效应”。
因此,“双盲控制”的目的,对于被试者而言,就是要尽可能地保证他们在反应变量上的变化确实能够反映实验变量的作用,而不是他们对自己实验身份(实验组成员还是对照组成员)意识的心理作用;对于主试者而言,就是要尽可能地排除其主观意愿对客观地评价实验结果的干扰。
2.实验研究的设计
基本的实验设计要体现出“信度”和“效度”的原则。由于社会科学实验研究的特殊性,每次实验所用的样本不尽相同,实验条件难以控制,所以“信度”的原则比较难以贯彻,在实验中主要贯彻的是“效度”原则。
基本的实验设计分类所依据的正是实验的效度原则。实验设计的分类由简单到复杂,实验的效度也越来越高。总体上实验设计可以分为两类:简单设计和多组设计。简单实验设计也称为经典实验设计或古典实验设计,是最基本、同时也是最标准的实验设计。它考察的是一个自变量和一个因变量之间的因果关系。此外,它只分为一个实验组和一个控制组,或仅有一个实验组。多组实验则有三个以上的组,它可以考察多个自变量与因变量之间的关系。
(1)简单实验设计
简单实验设计只考虑一个因变量与一个自变量的关系,所以操作比较容易,实验设计相对比较简单。简单实验设计又可以分为以下几种模式。
①单组后测设计。这是一种最简单的实验设计。在单组后测设计中,只有一个实验组,没有控制组。在给予实验组实验刺激后,通过测量得到一个后测成绩。
设计的基本模式如下表:
表10-3 单组后测设计
单组后测设计由于缺少前测,所以不易于阐述因变量在经过实验刺激之后所发生的变化。因此它多应用在因变量在实验刺激之前不言自明的情况。例如,要测量罪犯对监狱管理的态度,就可以直接引进实验刺激因素,包括让罪犯看录像、听讲座等,然后测量他们的态度。在这个实验中,需要研究的是哪种工作方法对于改善罪犯的态度更为有效,在认识到罪犯在此前肯定对监狱管理存在抵触态度的前提下,可以直接采用单组后测的方法。
②单组前测后测设计。单组前测后测设计是对单组后测设计的一种改进,它增加了在实验处理前的测验,但还是只有一个实验组。设计的基本模式如下表:
表10-4 单组前测后测设计
这种实验模式的基本假定是:自变量的影响可以通过比较对因变量的前测Y1和后测Y2的差(D=Y2-Y1)来分析。尤其在分析自变量所引起的因变量的变化的实验中,这种方法被普遍采用。例如,如果在上例中我们主要想分析对罪犯各种工作手段的成效,或者说想知道采取了一系列的工作之后罪犯的态度究竟有什么变化,那么我们就需要采用单组前测后测设计。即在实施实验刺激之前对罪犯的某些态度进行测量,然后采用各种教育方法,最后再对他们这方面的态度进行测量,如果有变化,则可以归结为实验刺激的影响。
③两组前后测的实验设计。这是简单实验设计的标准模式,也称为典型的或传统的实验设计。设计的基本模式如下表所示:
表10-5 两组前后测的实验设计
(www.xing528.com)
这种实验设计的主要目的首先是为了排除自变量以外的其他因素的影响,从而提高实验的效度。其次,可以排除由于前测造成的某些干扰因素的影响。例如在有些实验中,由于实验对象在第二次回答问题(后测)时比第一次(前测)更加熟悉,所以,第二次的测验肯定要优于第一次。通过引进控制组,就排除了这种由前测造成的影响。因为这种影响可以通过对控制组的测量而表现出来,在分析自变量对因变量的影响时消去这种因素的影响,因而使实验更为精确。
这种实验设计的一般实施步骤为:第一步,随机指派实验对象到实验组和控制组;第二步,对两个组的对象同时进行第一次测量,即前测;第三步,对实验组给予实验刺激,但不对控制组实施这种刺激;第四步,对两个组的对象同时进行第二次测量,即后测;第五步,比较和分析两个组前后两次测量结果之间的差别,得出实验刺激的影响。
实验刺激的影响=实验组的差分-控制组的差分
=(后测1-前测1)-(后测2-前测2)
④两组无前测的实验刺激。由于在前面提到的前测对实验结果的影响,所以在有些实验中采用两组无前测的实验设计,可以克服前测对实验造成的负面影响,提高实验的外在效度。其基本模式如下表所示:
表10-6 两组无前测的实验刺激
这一设计有一个前提,即实验的对象是随机分配的。由于随机分配排除了人为设置的因素,所以,可以认为实验组和控制组的初始水平是相同的(虽然没有经过前测)。这样,对前测的省略实际上也排除了前测造成的交互作用效应,从而在更高的水平上体现出实验的效度。例如许多关于敏感问题的实验,更适合于采用此种实验设计。因为对敏感问题的前测本身往往会导致后测的变化,而实验刺激本身变得并不重要了。
(2)多组实验设计
简单实验设计有两个主要的缺点:一是它排除了某些交互作用效应对实验结果的影响,二是它只考虑一个自变量和一个因变量之间的关系。为了克服这两个缺点,也就是说为了排除交互作用效应的影响,解决外在无效度的问题,同时为了分析多个自变量对因变量的影响,就需要多组实验设计。典型的代表是索罗门四组设计、重复测量设计和因子设计。
①索罗门四组设计。索罗门四组设计的核心思想是测量干扰因素和交互作用效应的影响,它综合了典型设计和无前测设计的优点。
索罗门四组设计涉及四组受试者,从一群人中随机分派,表10-7展示了这种研究的基本思路。
表10-7 索罗门四组设计
这种实验设计实际上是一种以最简单的形式把前面几种设计组合起来所得到的一种新的实验设计。该设计也是只有一种实验处理,随机选择被试和分组;一共四个组,两个实验组,两个控制组;两个实验组中,一个组有前测与后测,一个组只有后测;两个控制组中,也是一个组有前测与后测,另一个组只有后测。在上面的基本模式中第1、2组是实验组,第3、4组为控制组;第1、3组有前测与后测,第2、4组只有后测。
这种设计的优点在于:可以区分出外部因素和测量干扰的影响,克服了实验组、控制组仅施后测设计和实验组、控制组前后测设计两种设计的缺点;实验者可以对四个组的实验数据进行多种比较;实验者还可以运用2×2方差分析来处理四个组的实验数据。
它的缺点是:设置四个组,必然会增加受试者人数,增加了实验的困难;所得结果需要经过复杂的统计检验,往往使简单的问题复杂化;它只能判断其他外部因素对因变量的影响,但无法确定哪些变量与因变量还存在因果关系。
②重复测量设计。在一些实验中,受试者要接受多次相同测量。例如在学习实验中,受试者常常完成一系列任务,解决一系列问题,以了解学习是否已经发生。实验效果不是以不同组的观测值差异来表示,而是通过每个组对不同刺激的差异来反映。
例如,要测量不同学生解答形象思维和逻辑思维智力测验题的差异,可作下列设计,如表10-8所示:
表10-8 重复测量设计
可以看出,重复测量是一种轮换的方法,即每个组都先后接受不同的测量,然后通过比较每一组不同测量的平均值就可以检验不同刺激造成的不同差异。它的优点是:不用随机抽取实验组和控制组,而只需选取几组实验对象让他们参加各种项目的测验,因此,不用担心组间特征值随机误差的影响;只需较少的受试者就可以达到目的;它的实验假设可以有多个。重复测量设计的缺点在于多次重复测量容易使人们熟悉这一特定的特征。解决这一问题的途径是均衡设计,即打乱问题的排列顺序,对实验处理进行平衡。
③因子设计。因子设计是为了考察两个以上的自变量对因变量的影响以及自变量之间交互作用对因变量的影响。它假定外部因素的影响等于零。并且为了消除前测引起的影响和减少工作量,一般都运用无前测的设计。
例如,要测量企业的劳动纪律和福利待遇对劳动生产率的影响时,可以作出如表10-9所示的测量设计:
表10-9(2×2)因子设计
表10-9中有两个自变量(X1和X2),每个自变量有两个值(有和无),因此可以分为四个组,称为2×2的因子设计。因子设计可以同时包括多个自变量,每个自变量可以有多个取值。但是,随着自变量的增加,实验组的数目也要相应增加。因子设计虽然可以阐明不同因素对于因变量的影响,但是它自身也有缺点。在分析多个因素的影响时,往往需要设置许多实验组,每增加一个变量,实验组的数目都要成倍增加,需要的受试者的数量也非常多,因此,在一般情况下是难以实施的。
【注释】
(1)本章主要参考了袁方、林聚任、刘玉安、风笑天以及艾尔·巴比等学者有关研究成果。
(2)详见本章第二部分“实验研究的基本理论”中“2.实验研究的要求”的相关内容。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。