课题的研究假设是通过揭示变量之间的关系提出来的。只有界定研究变量,才能提出明确的研究假设,才能界定具体的研究内容。研究变量设计是研究假设设计的重要支撑,可以回答“研究什么”的问题。
变量设计即根据假设,分析本课题的自变量是什么,因变量是什么,有哪些无关变量。对课题涉及的有关“变量”进行明确的界定,并正确写出概念性定义和操作性定义。
(一)变量的定义
研究问题的本身常提供研究的大致方向和范围,但要具体表述研究的问题和研究过程时就要用到变量等概念。在研究中,特别是定量研究中,影响因素往往都用变量的形式表现出来。
变量就是在质或量上可以变化的事物的特征,或可以测量、操纵的条件和现象。心理与教育研究就是通过调查、测试、实验等方法来揭示变量间的关系。
按照在研究中的关系,变量分为三种类型:
1.自变量
研究者掌握并主动操纵,能够使研究对象变化的量,往往又称为原因变量。例如,研究学生智力与学业成绩的关系,学生“智力”的高低影响“学业成绩”,那么“智力”就是该项研究的自变量,是研究者要测量或操纵的原因变量。在调查研究中,自变量多为属性变量,如性别、年级、家庭类型等被试信息。在实验研究中,自变量是研究者采取的措施、实施实验处理等。
2.因变量
是由自变量的变化引发变化的行为、因素或特征,是研究的结果,是研究中需要观测的指标,又称反应变量或结果变量。例如,研究者想研究噪声对学习效果的影响,“噪声”就是自变量,研究者可通过改变噪声的时间或强度等来操纵这个变量。而“学习效果”则是因变量,它是“噪声”这个自变量作用于被试后产生的效应,是研究者要测量的结果变量。在实验研究中,因变量是实验操作要达到的实验效果。在调查研究中,因变量多为所需要测量的行为变量、态度变量。
3.无关变量
也称控制变量,是指与自变量同时影响因变量变化,但与研究目的无关,需要加以控制的变量。例如,研究两种不同的教学方法对学生学业成绩的影响,在这里“教学方法”是自变量,“学业成绩”是因变量,除此以外其他各种因素都是无关变量。无关变量在这项研究中,可能会有教学时间、教学环境、学生的智力、原有的知识基础、家教辅导等等因素,这些因素会干扰自变量和因变量的对应关系。这些因素与自变量(教学方法)的作用混杂在一起,往往会导致人们难以确定两种教学方法效果的优劣,无法判断最终的研究结果(因变量)是来自教学方法(自变量),还是来自教学时间、教学环境、学生的智力、原有的知识基础、家教辅导等等其他因素(无关变量)。如果研究者能有效地控制这些无关变量,研究结果就会比较明确可靠。
(二)变量的类型
在心理与教育研究中,变量间有不同的关系,按照不同角度分类,变量主要有以下几种类型。
1.相关变量和因果变量
这是根据变量间关系的性质来划分的。所谓因果关系是指一种变量的变化直接导致了另一种变量的变化。如将教学方法和学生成绩看作两个变量,这两个变量间的关系就是因果关系。其中主动变化的变量称为自变量,如在研究中研究者主动变革的教学内容、教学方法等。由自变量的变化引起变化的变量,称为因变量。如由教学方法变化而引起变化的学生成绩就是因变量。在研究中自变量和因变量都可能是一个或多个。
相关关系比较复杂,相关关系中有可能包含暂时未认识的因果关系。如将学生的生物成绩和化学成绩看作两个变量,这两个变量就是相关关系。相关关系有三种,如果两变量的变动方向相同,即一变量变化时,另一变量同时发生或大或小与前一变量相同方向的变动,这种相关被称作正相关,如学生努力程度和学习成绩的相关就是正相关。第二种是负相关,即一变量变动时,另一变量发生或大或小与前一变量方向相反的变动,如打字练习次数越多,出现错误就越小。第三种相关是零相关,就是一变量变动时,另一变量做无规则变动,如学习成绩和体重间的关系。
2.主体变量与客体变量
这是以研究对象为主体划分的。主体变量指存在于研究对象主体上的各种变量,如性格、受教育水平、态度等。客体变量指存在于研究对象主体以外的各种变量,如父母教养的水平、教师对学生的态度等。
3.研究变量与无关变量
这是根据变量能否成为特定研究所要操作的对象来划分的。研究变量指特定的研究中要操作的变量。无关变量是与某特定研究目标无关,但对研究结果可能有影响的变量。例如,研究两种不同教学方法对学生成绩的影响,在这项研究中,教学方法与学生成绩都是研究变量,因为本项研究在于弄清楚教学方法对学生成绩的影响,因此教师的水平、学生先前的基础、学校的环境等其他因素在这项研究中都是无关变量。
变量还可有其他分类,如根据研究能否直接对变量进行测量划分为直接测量变量和间接测量变量,根据变量能否由研究者主动操作而划分为操作性变量和非操作性变量等。需要说明的是,以上变量的分类是按不同标准进行的,它们是相互交叉的。
(三)变量的抽象定义与操作定义
课题中的研究变量一经确定,就要给变量下定义,给研究变量下定义主要有两种:一是抽象性定义,二是操作性定义。
1.抽象性定义
抽象性定义也称概念性定义,以严谨、精确的语言来概括研究变量的共同本质。它以概念的形式描述和界定研究变量。抽象性定义方法主要有以下几种:第一种是经典的定义方法,即“指什么,具有哪些属性”。第二种是从文献中寻找合适的定义。例如对智力的抽象定义:人们在获得知识和运用知识解决实际问题时所必须具备的心理条件或特征。对饥饿的定义:机体血糖水平低于正常值时的躯体状态。
2.操作性定义
操作性定义是根据可观察、可测量、可操作的特征来界定变量的含义,即从具体的行为、特征、指标上对变量的操作进行描述,将抽象的概念转换成可观测、可检验的项目。例如对智力的操作性定义:在斯坦福-比纳智力量表上的分数。对饥饿的操作性定义:空腹24小时;空腹48小时。操作性定义有利于提高研究的客观性,有利于提高研究结果的可比性,也有利于研究的评价、结果的检验和重复。
在许多实际研究过程中,操作性定义和抽象性定义都是需要的,各有其特点。①定义内容上,操作性定义是描述变量的具体行为、特征和指标;抽象性定义是描述变量的本质特征。②方法上,操作性定义采取条件描述、行为描述、指标描述等方法进行表述;抽象性定义采取经典定义、抽象定义、解释性定义等方式。③作用上,借助操作性定义对变量的界定清楚明确,便于操纵和测量,但往往只能涉及变量的少数特征,具有明显的排他性,难以表达完整意义。通过抽象性定义可以涵盖研究变量所属的基本特征,解释范围较大,具有普遍性,但往往失之笼统,无法据此测量和操纵研究变量。比较理想的方式是先用抽象性定义描述变量的基本特征,然后再用操作性定义规定操作程序和测量指标,这样便于把握操作性定义的方向和意义。
实际上界定研究变量是研究从“概念化”过渡到“操作化”的桥梁,是研究设计的关键。下操作性定义实际上是一个将抽象概念具体化的过程,在整个研究过程中具有重要作用。
操作性定义的方法很多,主要有以下三种:
(1)条件描述法
条件描述法通常是通过陈述测量操作程序来界定一个概念,是对所解释对象的特征或可能产生的现象进行描述,对要达到某一结果的特定条件做出规定,指出用什么样的操作去引出什么样的状态,即规定某种条件,观察产生的结果。这种方法常用于给自变量下操作性定义。例如,要给“饥饿”下一个操作性定义,饥饿是一种自身感受,那么怎样才算饥饿了呢?心理学家用条件描述法给饥饿下了一个操作性定义:饥饿,指连续24小时没进食物的状态。下面再举几个例子:①竞争关系。两个以上的同伴,所处环境相似,大家都有相同的目标,但只允许其中一人达到目标,这时同伴之间的关系为竞争关系。②智力。在斯坦福-比纳智力量表上的分数。③自信心。学生对即将来临的期终考试可能获得分数的估计值。
(2)指标描述法(www.xing528.com)
指标描述法通常是通过陈述测量操作标准来界定一个概念,是对所解释对象的测量手段、测量指标、判断标准做出规定。通常这些指标能做量化处理,常用于给因变量下操作性定义。例如,“青少年”可以界定为“年龄在7岁以上、18岁以下的人”。下面再举几个例子:①发散思维。对同一物体多种用途的设想能力,具体指标为在60秒内回答砖的不同用途达10项以上为优秀;5项至9项为一般;5项以下为差。②阅读能力。用阅读测验表上中等难度的文章进行测验,要求阅读速度达到200字/分以上、辨别达到90%以上、理解达到80%以上、记忆达到70%以上为合格。③差生。在标准化成就测验中的分数低于个人智力所预测的成就分数一个标准差的学生,或者两门主课不及格的学生。④教育文化水平。用一个人在学校接受教育的年限来表达,小学毕业的为6年,高中毕业的为12年,大学毕业的为16年,等等。
(3)行为描述法
行为描述法通常是通过陈述测量结果来界定一个概念,是对所解释对象的动作特征进行描述,对可观测的行为结果进行描述。通常这种操作性定义用于给因变量下定义,解释客体的行为。例如,心理学家为了用饥饿的小白鼠做实验,给“饥饿”的小白鼠下了一个行为描述的操作性定义:一分钟内压低杠杆10次以上而获取食物的小白鼠。只有达到这样行为频率的小白鼠才属于饥饿状态。下面再举几个例子:①旁观。注视别人的活动2分钟及以上,自己未参与。②合作。对别人的活动给予支持,并直接参与活动,成为其中一员。③谦让行为。在分配糖果时谦让行为可以分成三种水平:“主动谦让”指没有任何人提醒或暗示,都能将糖果让给别人;“被动谦让”指在他人的提醒或暗示下,才肯将糖果让给别人;“不谦让”指经他人再三提醒,都不肯把高级糖果让给别人,一定要自己享用。④失眠。入睡时间超过45分钟;夜间觉醒次数超过2次或凌晨早醒。
给变量下操作性定义要注意以下几点:
1.研究课题中重要的变量要下操作性定义
一般来说,研究假设中涉及的变量,在整个研究中起关键作用的新概念、新名词等要下操作性定义。例如,要研究儿童的创造能力,创造能力就是这项研究中的重要变量,不对这个变量下操作性定义,研究是难以进行下去的,因为创造能力本身不会告诉人们创造能力的具体指标是什么,如何去测量,用什么去测量。
2.操作性定义在研究过程中应该是独特的
操作性定义是研究者出于研究需要而规定的特殊解释,并非对变量的全面的、唯一的解释。如果对变量做全面的解释,能囊括变量的所有含义,这样的定义必定是抽象性定义。操作性定义比较灵活,研究者可以根据自己研究的需要界定变量,对同一个变量可以有不同的操作性定义。例如,研究者把儿童的智力定义为:在韦克斯勒儿童智力量表(WISC-CR)上测得的分数。当然,我们也知道测得的分数并非某个儿童智力的全部,仅仅代表该儿童整个智力的一部分。但在这项研究中,研究者就把这测得的分数看作该儿童智力的指标,用来代表该儿童的智力,这就是操作性定义的独特性。因为要将智力的所有因素都测量出来才能确定该儿童的智力是无法做到的。再如:有人要研究大学生的学习态度,对学习态度可以通过查阅教育词典、百科全书、教科书等获得抽象性定义,或者自己给学习态度下一个抽象性定义。但这样的定义往往无法具体操作、测量,只能做价值判断。研究者试图给学习态度下操作性定义,以便对学习态度进行测量,获取资料。他将学习态度定义为:本学期学生上课的出勤率。然后研究者就需要每周上课获取点名出勤率的资料情况。当然学习态度涉及很多因素,会有很多指标,如上课的参与程度、举手发言频率、作业的正确率等,出勤率仅仅是其中的一个因素,但研究者就以出勤率来代替学习态度,以出勤率解释学习态度,这就是操作性定义的独特性。因为研究者不可能,也没有必要将学习态度涉及的所有因素都研究一番,才能了解学生的学习态度。
3.操作性定义必须兼顾排他性与普遍性
定义的排他性越大,解释的范围越小,普遍性也就越小。如“攻击性”的操作性定义可以选择以下三种中的一种:(1)曾与同学吵嘴或打架——排他性最低,外延最广,包含吵嘴和打架两种行为。(2)曾与同学打架——排他性略增,缩小范围,排除吵嘴行为。(3)每周至少与同学打架一次——排他性最高,只含每周至少一次的打架行为。操作性定义如果普遍性太低,则解释的范围有限,研究结果易流于褊狭;但如果排他性太低,则恐失之笼统,而不易掌握操作测量的本义。因此如何兼顾排他性和普遍性是个比较难以权衡的两难问题。一个基本的策略是:尽量用多种特征作为操作或测量的标准,以增强取舍的弹性。
(四)界定与操纵研究变量
教育研究中,“控制”这个术语表示研究者对整个研究过程的把握与操纵。从广义上说,控制表示研究者能够操纵或选择自变量的变化水平;选择因变量以及测量因变量的方法;控制研究过程中的无关变量。从狭义上说,控制是指对影响自变量和因变量之间对应关系的无关变量的处理和控制。控制在教育研究过程中具有重要作用,它是决定研究结果是否确实可靠的重要因素。控制研究变量包括三项内容:对自变量的操纵;对因变量的测量;对无关变量的控制。
1.对自变量的操纵
研究者能够操纵或选择自变量的变化水平,自变量的变化完全取决于研究者的操纵。按自变量的性质,可分为刺激变量(stimulus variable)和机体变量(organic variable)两类:
刺激变量是指促使个体产生反应的一切事物。这些事物可以是来自外部环境的能量变化,也可以是来自个体内部的生理变化。如果自变量属于刺激类的变量,那么研究者就能直接操纵这个变量,改变它的数量或强度。例如,探讨噪声对学习的影响,噪声就是刺激类的自变量,研究者可以直接控制、操纵噪声的强度,来研究对学习可能会有怎样的影响。大多数研究的自变量属于刺激类自变量。对研究变量的操纵往往涉及次数、强度、方式、程序、介入时间、延续时间等。
机体变量指个体的生理特征,如个体的性别、年龄、身高、血型、体形等,也包括个体的心理特征,如智力、学历、性格等。当自变量属于机体变量时(如年龄、性别、性格等),由于研究者无法改变个体独有的生理心理特征,因此无法直接操纵机体变量,只能采取选择的手段来控制自变量。例如我们想探讨学生的智力与数学能力之间的关系,由于智力是机体变量,我们无法直接对学生的智力进行操纵和控制,用按照智力分数对被试划分区组,在区组内接受所有的实验处理。因此,只能采用预先测量,根据实测分数选择的方法。进行一次智商测验,从总体中选取智力水平高、中、低三个区组被试进行研究。
控制自变量需要考虑以下一些具体问题:
(1)选定的自变量是否可以操纵或测量?可以操纵的自变量是指研究者能够控制、调节、操作并有规律地变化的条件。如实验中的文字、声音、作业难度、时间等都是可以由研究者主动操纵控制的条件。不可操纵的自变量是研究者无法控制和改变的条件,如性别、年龄、发展水平等。一般可操纵的自变量可采用实验研究方法。
(2)确认自变量宜有几个。只有一个自变量的研究称为单因素研究,有两个或两个以上自变量的研究称为多因素研究。研究中自变量越多,需要控制的因素也就越多,设计的方案就越复杂,研究结果的内容也就更丰富,意义更深刻。
(3)确认自变量的水平(层次)需要多少种。实验研究在操纵自变量时,至少要有两个水平(层次),即自变量“有”还是“没有”,“出现”还是“没出现”。例如药物治疗多动症,有“服药”和“没服药”两种水平。有时为了比较用药量的最佳治疗效果,可以将自变量的水平分为多个等级,如分为没有服药的、服1毫克药的、服2毫克药的、服3毫克药的四种水平,然后观察服药后的行为表现。多因素设计涉及自变量的数量和水平,通常以数字表示实验设计模式。例如2×2设计,这是因素设计中最简单的模式。它的含义是实验自变量数有两个,即“×”前后的数,而数值则意味着“×”前的自变量有两种水平,“×”后的自变量也有两种水平。如果是2×3×2设计,就意味着这个实验有三个自变量,第一个自变量有两种水平,第二个自变量有三种水平,第三个自变量有两种水平。2×3×2设计要比2×2设计复杂得多,因为2×3×2设计要组合成12个组,即2×3×2的乘积,而2×2设计只需4个组。因此,因素设计中自变量数越多,数值越大,研究也就越复杂。
2.确定因变量
在此,要注意两个问题:①列出主要的因变量,从而明确课题研究的主攻方向和主要目的。教学过程的自变量很多,有教育者、教学内容、教学方法、教学手段、教学环境、教育对象的复杂性等。教育过程中的因变量也很多,有智能方面的如注意、记忆、思维、想象、学业成绩、能力等,也有非智力因素如动机、兴趣、情感、意志、性格等。要对因变量考虑得尽可能全面、完整。②确定测量检验因变量的指标:一方面,对因变量做出具体的说明和界定,明确研究的具体成果是什么;另一方面是确定观测因变量的具体指标是什么,以便准确评价因变量达到的具体水平,这样可提高研究的客观性和研究结果的可比性。例如智力测验分数反映智力发展水平,学科测验成绩反映学业成就,体育测量数据反映身体素质状况等。
因变量的一个重要特征是它可以通过直接或间接的方式被观察、被测量,并且可以转化为数据形式,如测验分数、考试成绩、评定等级、反映时间、答题正误的百分比等。
因变量的测定关键是要有合适的测量指标,指标通常涉及测量方法、工具、材料、次数、时间、插入点的安排等。确定测量指标时,需要考虑以下几个方面:
(1)敏感性。所选指标对自变量的变化有较高的分辨能力。举例说,教育测量中,五分制评分与百分制评分相比,百分制敏感性较高,精确程度也较高。一般而言,因变量的测量工具应选敏感性高的、精确程度高的指标体系。
(2)客观性。所选指标可以观察、可以测量,具有可靠性和准确性,且指标的解释不以研究者或被试的主观意志为转移。在教育研究中个体行为错综复杂,一个刺激可能会产生各种各样的反应。例如,巴甫洛夫的经典条件反射实验,以铃声作为刺激物(自变量),观察狗的唾液分泌(因变量)。事实上,狗对铃声情景条件会有很多反应:摇尾、抖腿、竖耳、警觉、逃跑、汪汪叫、唾液分泌等。为什么巴甫洛夫选择唾液分泌反应作为测量的因变量而不选择其他指标呢?主要原因是唾液分泌具有较高的一致性,即狗对在同一刺激情况下产生的众多反应中,唾液分泌反应的变异程度最低。因此,一致性程度较高,可靠性或准确性也较高。
(3)稳定性。所选指标在重复测验中数值接近,能获得稳定一致的结果。例如,某个智力测验的确能够测量个体的智力,并且在反复多次测量中所得的数据资料差不多,那么这个智力测验具有较高的信度和效度。而老师随堂出的测验卷则由于难以重复,缺乏可比性,则稳定性较差。测量工具的稳定性一般通过求重复测量的相关系数来确定。
(4)适合性,所选指标要能准确反映变量的基本性质。以被试的数学学业水平作为指标来判断被试是否有精神焦虑,数学测验成绩分数就不是合适的指标。以小学生书包重量作为指标来研究学生的负担,书包重量就不是一个合适的指标。
如何选择最佳的因变量以及如何精确地测量因变量的变化是研究者最为关心的问题,这关系到研究成果的精确性和可靠性。在选择因变量时要注意:
(1)对因变量尽可能采用直接测量,万不得已才用间接测量,如有研究者想测量学生课堂学习注意力集中的程度,一时又难以找到直接测量学生注意力的方法,他就采用间接测量的方法,用录音机录下汽车喇叭声、鸟叫声、钢琴声、哨声、自行车铃声等,每种声音持续时间10秒,各种声音之间有间隔。上课后,研究者在教室外以学生听觉阈限之上的同一音量播放录音。课后立即要求学生用再认法和回忆法在问卷上回答上课时所听到的声音,以此间接地测量学生注意力的集中程度。
(2)采用权威的测量工具。测量工具多种多样,测验量表各不相同,通常要选择公认的工具和量表,最好是标准化测验,有常模参照的,这样可以保证测量的效度。如要测学生智商用韦克斯勒儿童智力测验量表(WISC);研究学生人格关系用卡特尔人格量表(16PF)或明尼苏达多相人格量表(MMPI)。
(3)测量指标要合适。在自行设计如何测量因变量的过程中,要使自变量对因变量的变化影响最大化,使因变量能敏感地显示自变量的变化,使这种变化的范围更宽广、更合适。测量要避免天花板效应和地板效应。例如要研究噪声对学生解答数学问题的影响作用,噪声是自变量,解答数学问题的成绩是因变量。如果研究者将数学测验设计得非常简单,不论被试接受何种水平的噪声,都可轻易解答,获得高分,从而无法区别出不同程度的噪声对解答数学问题的影响。这一结果并不表明噪声对解答数学问题没有影响,而是测量指标过于偏窄、集中,没有区分度的缘故。同样道理,如果研究者设计的数学测验特别难,所有的被试都得零分或低分,也同样不能显示不同程度的噪声对解答数学问题的影响。
(4)采用多种测验方式。为了保证因变量测量的效度,提高测量的准确性和可靠性,可采用多项测验方式,互相印证自变量对因变量的作用。也可以进行重复测验,确认自变量与因变量之间的因果关系。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。