首页 理论教育 巴甫洛夫行为疗法的理论及应用

巴甫洛夫行为疗法的理论及应用

时间:2023-11-18 理论教育 版权反馈
【摘要】:条件反射是以无条件反射为基础而形成的。巴甫洛夫通过经典条件反射原理不仅揭示了生物正常行为产生的原因,而且也揭示了异常行为产生的原因。已有一些行为治疗家提出,对包括神经症和神经病在内的许多人类的适应不良行为都可以用这种方式来理解。(二)操作性条件反射原理操作性条件反射原理是由美国新行为主义的主要代表人物斯金纳提出的,但有关这一原理的最早论证则是由桑代克在1911年做出的。

巴甫洛夫行为疗法的理论及应用

(一)经典条件反射原理

经典条件反射(classic conditioning)又叫作应答条件作用或巴甫洛夫条件作用。俄国著名生理学家巴甫洛夫(Z.P.Pavlov)在实验室研究狗的消化过程中,无意间发现了应答性的条件反射作用,即经典条件反射原理。他注意到狗不仅仅是在食物出现时流唾液,而且在与食物出现有关的其他刺激物单独出现时也流唾液。为了证实这一点,巴甫洛夫进一步实验,在给狗食物的同时又给狗一个节拍器的声音刺激,食物和节拍器声音结合几次之后,狗一听到节拍器的声音(未给食物)就会有唾液流出。他发现如果对无条件刺激物——食物的反应能通过无条件刺激物与中性刺激物(节拍器声音)的结合,使狗对中性刺激物也产生相同于对无条件刺激物的反应,就形成了条件反射。此时,中性刺激也可以称为条件刺激。进一步又发现,几乎任何的先天反应如眨眼等都可以与任何刺激如声音、颜色、口令等建立起一种条件反射。但若条件刺激多次出现,而没有无条件刺激的强化,这个条件反射也可以被消退。其基本过程如表3-1所示。

表3-1 经典条件反射原理

续 表

注:UCS——无条件刺激,UCR——无条件反射,CS——条件刺激,CR——条件反射。

条件反射是以无条件反射为基础而形成的。一个中性刺激通过与无条件刺激配对,最后能引起原来只有无条件刺激才能引起的反应,这就是初级条件反应的形成。在初级条件反射的基础上又可以引入一个新的中性刺激建立次级条件反射。由于人具有使用概念和语词的能力,可以用概念和语词替代任何具体的刺激物,所以人能够以语词建立极其复杂的条件反射系统。华生曾经认为,经典性条件反射是一切行为的基本单位,意思是一切行为都可以通过分析还原为一个(巴甫洛夫)条件反射。这一看法后来由于操作性条件作用和其他学习形式的发现被推翻了。但经典的条件学习的确是许多行为的获得途径,这一点是毋庸置疑的。遗憾的是,我们很难确认到底哪些种类的不良行为源于经典条件反射,因为许多行为既能通过经典的方式,也能通过操作的方式获得。一般而言,经典条件反射的概念有以下五点。

1.强化

强化即伴随条件刺激的呈现给予无条件刺激。例如,在经典的条件反射实验即对小阿尔伯特的实验中,白鼠出现(条件刺激)的同时,给予一个强噪声(无条件刺激)。强化是形成条件反射的基本条件。

2.泛化

泛化指对一个条件刺激形成的条件反应,可以由类似的刺激引起。反过来说,条件反应可以迁移到类似原条件刺激的刺激上。在对小阿尔伯特的实验中,小阿尔伯特对白鼠产生的恐惧反应,也可以由白猫、小兔、狗乃至一块棉花引起。俗话说“一朝被蛇咬,十年怕井绳”,也是泛化的表现。临床症状上许多恐怖症都有泛化情形,如一位妇女可能由一次外出偶然受惊而逐渐演变为害怕一切公共场所(广场恐怖症症状)。因此,泛化可能是许多症状得以维持和发展的原因。

3.分化

分化是与泛化相对的过程。在泛化发生后,继续进行条件反射训练,但只对特定条件刺激予以强化,对类似刺激不予强化,会导致有机体抑制泛化反应,只对特定条件刺激发生反应,这就是分化。分化意味着有机体逐渐能够分辨刺激物之间的性质差异,分化的形成是选择性强化和消退的结果。

4.消退

已形成的条件反射由于不再受到强化,反应强度趋于减弱乃至该反应不再出现的情形称作条件反射的消退。消退概念对临床应用有两个潜在的意义:其一,如果一个变态行为得以维持,在个体环境中一定存在使之得以维持的强化条件(因为如果不存在这种条件的话,该变态行为应该已经自行消退);其二,可以改变环境变量,使之不再包含强化变态行为的条件,促使变态行为消退。但是,消退并非全面、永久性的遗忘。实验表明,如果对已消退的条件反射重新训练的话,所需训练次数要比原来建立该条件反射的次数要少。这一“节省”现象说明,原来的条件作用训练残留了某种永久性的后效,同时也使人想到消退很可能不是一种消极过程。换言之,对一个已发生消退的条件反应来说,原来的条件刺激(它本来是强化物即将出现的信号)现在变成了这样的信号——原来的强化物不会出现!这就导致了对原来反应的抑制。

5.抗条件作用

如果对一个已形成的条件反应进行这样的操作:一方面撤除原来的强化物,如在白鼠出现后不伴以强噪声(这是前述消退训练的程序);另一方面,设法使一个不能与原来的条件反应共存的反应与原来的条件刺激建立联系,如让小阿尔伯特吃他喜欢的食物(一种放松的积极的反应)。结果,原来的条件反应会更迅速地被消除(与单纯消退训练比较),这样一种操作程序称为“抗条件作用”(anti conditioning)。抗条件作用就是前面提到的沃尔帕所说的“交互抑制”,它是几种重要的治疗技术如厌恶疗法、系统脱敏训练的理论基础。

巴甫洛夫通过经典条件反射原理不仅揭示了生物正常行为产生的原因,而且也揭示了异常行为产生的原因。他通过条件反射原理将狗训练成每当看见椭圆形时就流唾液,然后把椭圆形逐渐变成圆形,当狗再也不能辨别椭圆形(该流唾液)和圆形(不该流唾液)时,也即狗无所适从时,竟会出现精神紊乱,狂吠、哀鸣并咬坏仪器等实验性的神经症的症状。其他实验研究也表明,伴有强烈的情感和情绪的许多过敏反应,如抑制不住的脾气爆发、内脏的反应等,都可以理解为是习得的条件反应。已有一些行为治疗家提出,对包括神经症和神经病在内的许多人类的适应不良行为都可以用这种方式来理解。

美国著名心理学家、行为主义理论创始人华生(J.B.Watson)在20世纪20年代做过一个实验:他在原来很喜欢小白兔的幼儿背后击锣发出声响,引起恐惧反应。反复数次后,在小白兔与巨响之间建立起条件反射。于是,当小白兔出现时,幼儿就表现出了恐惧、哭闹和不安。而且,儿童的这种恐惧情绪反应扩大到其他带毛动物。由此他认为,我们无论成为什么人,都是后天学习的结果。而且,人类习得的不良行为,也可以通过学习而消除。

(二)操作性条件反射原理

操作性条件反射原理是由美国新行为主义的主要代表人物斯金纳提出的,但有关这一原理的最早论证则是由桑代克在1911年做出的。桑代克把猫关在迷箱之中,它们可借助于拉线圈、推动杠杆、转动按钮而逃出来。关在迷箱之中的猫一开始挤、搔门,抓、咬放在迷箱里的东西。把爪子伸出来等,尝试进行多种方法以逃出迷箱。最后,它们偶然发现了打开迷箱的机关(如通过拉线圈打开迷箱的门)。以后,猫的错误行为渐渐减少,而成功的反应得以保存了下来。动物就是这样通过“尝试与错误以及偶然的成功”,学会了如何逃出迷箱。

桑代克由这些资料开始进行研究,后来提出了著名的效果律,即一种行为过程的发生次数受该行为的后果影响而改变。效果律所反映的是人或动物保持或消除先前反应与效果之间的关系。一种行为之后出现了好的效果,这种行为就趋向于保持下来;如果效果不好,则趋向去被消除。这也是斯金纳等人称为强化的一种关系。

斯金纳本人也做过许多实验研究。他研制出一种称为“斯金纳箱”的实验仪器。斯金纳箱是为动物学习实验的自动记录装置。他的一个实验是这样进行的:在斯金纳箱上有个小圆窗,当小窗有某种特殊的光出现时,鸽子去啄它就可使一粒食物送到食盘中。鸽子先是围箱乱转,胡乱地啄这啄那,最后碰巧啄到了有光的小窗,自动装置使食盘中出现了食物。这种对于适宜反应的奖励就是强化。以后,鸽子就更倾向于啄小窗而不去啄别的东西了。但当窗子是暗的时候,不管鸽子怎样啄,食物都不会出现。经过若干次尝试之后,鸽子进一步学会只在这个窗子有光时进行反应。

他的另一个实验是这样进行的:箱内有杠杆和与食物储存器相连接的食物盘。在箱内的白鼠按压杠杆,就有一粒食物丸滚入食物盘,便获得食物。一只饿鼠进入箱内,开始时有点胆怯,经过反复探索,迟早会做出按压杠杆的动作,一粒食物丸落入盘内,若干次后,就形成饿鼠按杆取得食物的条件反射,斯金纳称此为操作性条件反射。虽然许多与情绪反应相联系的行为和习惯可能是应答性条件作用的结果,但人们普遍认为,人类更大范围的行为类型是通过操作性条件反射过程获得的。

斯金纳通过操作性条件反射实验认为,人的大多数行为都是习得的,包括不良行为和心理疾病的症状。斯金纳曾举过一位母亲不知不觉地在孩子身上强化不良行为的实例。有时当母亲正在非常忙的时候,她可能对孩子温和的呼唤或心平气和的要求置之不理。这时,孩子只有提高嗓门,大声喊叫,随后,孩子只有用更大的声音才能引起母亲的反应。这种恶性循环,导致了孩子越来越响的语言行为。实际上,这位母亲的做法就在不知不觉中教会了孩子如何大喊大叫才能引起人的注意。此外,如强迫症、疑病症、癔症的许多异常的补偿症状,都是通过实际的或心理上的满足而获得强化的。(www.xing528.com)

行为治疗家认为,症状就是适应不良的行为和习惯,他们不承认有神经症。正如艾森克所指出的.在症状之下不存在什么潜在的神经症,仅仅是症状本身而已,消除了症状也就消除了不良神经症。该观点认为,心理咨询或心理治疗也是通过强化来矫正不良行为的。1924年,琼斯(M.E.Jones)对患有动物恐惧症的三岁小孩进行治疗,把他惧怕的动物放在他面前,同时给他喂食,每天一次,两个月后,小孩的恐惧症状消失。说明饥饿时得到食物这个强化物,可使他克服原来学习得来的恐怖行为。

操作性条件反射(operant conditioning)又叫工具性条件反射(instrumental conditioning)。它的关键之处是有机体(动物或人)做出一个特定的行为反应,这个行为反应导致环境发生某种变化,即发生了一个由有机体引起的事件。这个事件对有机体可能是积极的,有适应价值;也可能是消极的,有非适应价值。不管是哪一种,这个事件都会对有机体继后的反应有影响。如果事件具有积极价值的话,有机体会更倾向于做出同样的行为;如果具有消极价值的话,则会抑制该行为。这自然是一种学习,通过这种过程,有机体“知道”了行为与后效的关系,并能根据行为后效来调节行为。

虽然并非如斯金纳设想的那样,一切行为都可以通过操作性条件反射来解释,但的确有无数的行为和经验是通过操作性条件反射获得的。例如,被火烧过一次的儿童再也不会去捉那美丽的蜡烛火苗,饿了却会放声大哭,因为哭叫每次都能带来乳汁;假如生病能带来那么多的关照、安慰并能逃避烦恼的话,你不应该奇怪人们为什么会“泡病号”;既然金钱能买到几乎一切“好东西”,那么千千万万的人为了钞票奔走钻营乃是天下最容易理解的道理了。

既然人们的行为是由行为的后效来塑造的,那么,有意识地设置一些环境条件,使特定的行为产生特定的后效,就可以人为地控制、塑造行为。操作性条件反射的治疗原理就在于此。

操作性条件反射的一些重要概念有强化、惩罚、消退、强化程序等。我们会发现,它们与经典条件反射的概念有一些共同之处,但也有明显区别。

1.强化

强化是操作性条件反射的核心概念。强化分为正强化和负强化两种。正强化指的是,当个体做出一个行为后,给予一个积极强化物。正强化会增加个体做出该行为的频率。例如,在咨询会谈中,来访者进行自我揭示,咨询者给予点头、微笑等支持反应,来访者会倾向于进一步的自我揭示。负强化指的是,当个体做出一个行为后,出现一个消极强化物撤去的事件,这也会增加该行为的出现频率。例如,当一只不断受到电击(消极强化物)的老鼠偶然碰到一个杠杆时,电击停止,老鼠以后在遇到类似情景时会增加压杠杆的反应。这两种强化的原理不难理解,困难在于如何确定一个强化物的性质,如何判断强化物是积极的还是消极的。有时候,对强化物是积极的还是消极的容易分辨,如那些与有机体的生存直接相关的事物或事件(食物、电击);但有时候,对强化物的分辨就很困难,如我们很难说被人爱总是一种积极强化物,被一个自己不爱的人爱可能是一件令人相当痛苦的事,所以在治疗中,针对一个对象选定一件合适的强化物是一项需要非常小心、仔细,甚至有时需要一定的想象力的工作。

2.惩罚

惩罚是和强化相反的概念,它涉及的是行为的消极机制。和强化一样,惩罚也分正性惩罚和负性惩罚。正性惩罚是指,当个体做出一个行为后,出现惩罚物。这以后个体会减少做出该行为的频率。例如,当一个攻击同伴的孩子打人之后,爸爸打他的屁股,这个孩子的打人行为会减少。负性惩罚则是指,当个体做出一个特定行为之后,他所向往的东西就不出现,这也会减少做出该行为的频率。例如,工厂规定迟到三分钟扣除一个月的奖金,就是利用负性惩罚。

3.消退

操作性条件反射的消退概念与经典条件反射的消退概念很接近。它指的是:在一特定的情形下,如果某人做出以前被强化过的反应,而现在这个反应没有得到通常的强化,那么此人下次遇到类似情形时,就较少可能再做同样的事。换言之,如果通过积极强化使一种反应的出现频率下降,要使这一反应完全消退,就需要进行多次消退训练。如果反应在消退期间不时受到偶然强化,则不仅不会出现消退,反而会使该反应更加牢固。因为这种情况已成为一种特殊的强化程序了。

4.强化程序

由于消退现象的存在,要使一个行为保持下去,就必须不断进行强化。但如果每次反应后均须予以强化,不仅实际上难以做到,而且这也不一定是最有效的强化办法。强化程序揭示了不同的强化安排的后效,它为强化方式提供了依据。

斯金纳研究了四种强化程序的效果,即固定比率强化程序、变动比率强化程序、固定时距强化程序和变动时距强化程序。

(1)固定比率强化程序

预先确定目标行为的出现次数,当足额次数的行为出现后即给予一次强化。这就是固定比率强化程序。例如,每当鸽子啄十次给一个食物球;计件工资制也是这种强化的例子。

(2)变动比率强化程序

依照一个概率(譬如0.1)给予强化,但强化的次数间隔呈现随机安排。在这种情况下,被试者平均每10次反应受到一次强化,但强化并不是在10次反应后一定出现。这种强化的典型例子是赌博,赌徒们即使一直在输钱,却被“下一次没准会赢”的念头驱使着不愿离开赌桌。研究表明,变动比率强化的行为比每次均强化的行为和固定比率强化的行为更难消退。

(3)固定时距强化程序

不管被试者做出多少次反应,均在一个固定时间后给予依次强化。例如,不管动物作了多少次按压杠杆的反应,均在一分钟后出现一次食物;按月发工资也是这种强化的例子。这种强化的一个后果是被试者在一次强化后反应频率急剧下降,直到下一次强化快出现时反应又迅速上升。

(4)变动时距强化程序

与变动比率强化类似,是按照一个有平均时距但每次时距随机变化的程序进行强化。

一般来说,按反应比率强化的行为出现频率高于按时距强化的行为;而变比率变时距的强化效果又优于定比率定时距的强化效果。但如果是形成一个新的反应,则100%的强化(每次正确反应均给予强化)效率最高。所以,理想的做法:在条件反应形成期采用100%强化(又叫连续强化),在维持期采用断续强化,尤其是变比率变时距强化。

在利用操作原理制定行为矫正方案时,常会结合使用不同的控制手段和强化程序。例如,在消除一个不适应的行为(采用消退或惩罚)的同时强化一个新的适应性行为(采用强化)。在塑造一个新行为时采用连续强化,随后改用断续强化以维持这一行为。多种手段和多种方式可以组合成各种不同的矫正方案。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈