操作性条件作用是指通过操纵行为的结果以影响行为发生概率。我们首先了解斯金纳的操作条件反射实验(见图8-2),以帮助我们学习这一非常重要的原理。
图8-2 斯金纳箱
斯金纳为研究操作性条件反射,精心设计制作了一种特殊的仪器,即一个阴暗的隔音箱,箱子里有一个开关(如白鼠作为被试,开关是一小根杠杆或一块木板;如以鸽子为被试,开头是一个键盘)。开关连接着箱外的一个记录系统,用线条方式准确地记录动物按或啄开关的次数与时间,如图2-5所示。这个实验装置被称为“斯金纳箱”。在实验时,并不是动物每一次按杠杆或啄键盘都给食物,食物的发放方式由实验者决定。箱壁上有一根横杆,装在一只小食盘和喷水口上面。老鼠在笼子里面爬来爬去,当它碰巧把前爪放在横杆上并压下它时,一粒饲料会自动落下到食盘里。笼子外面连接的一些设备会自动的在移动纸带上画出一条线,一分钟一分钟地记录下压下横杆的次数,从而记录老鼠的行为。下面呈现斯金纳的部分实验。
实验1:将一只很饿的小白鼠放入一个有按钮的箱中,每次按下按钮,则掉落食物。结果:小白鼠自发学会了按按钮。
实验2:将一只小白鼠放入一个有按钮的箱中。每次小白鼠不按下按钮,则箱子通电。结果:小白鼠学会了按按钮。但遗憾的是,一旦箱子不再通电,小白鼠按按钮的行为迅速消失。“惩罚”,作为奖励的邪恶双生子,可以迅速建立行为模式。然而,惩罚具有一定的副作用:它建立起来的行为模式,来得快,去得也快。一旦惩罚消失,则行为模式也会迅速消失。从长远来看,惩罚对于行为的制止并不会起到显著作用。
实验3:将一只很饿的小白鼠放入斯金纳箱中,由一开始的一直掉落食物,逐渐降低到每1分钟后,按下按钮概率掉落食物。结果:小白鼠一开始不停按钮。过一段时间之后,小白鼠学会了间隔1分钟按一次按钮。当掉落食物停止时,小白鼠的行为消失。
实验4:将一只很饿的小白鼠放入斯金纳箱中,多次按下按钮,概率掉落食物。结果:小白鼠学会了不停按钮。当不再掉落食物时,小白鼠的学习行为消失速度非常慢。随着概率越来越低,小白鼠按按钮的学习行为没有变化,直至40~60次按按钮掉落一个食物,小白鼠仍然会不停按按钮,持续很久一段时间。(同样的,用鸽子做实验,平均每5分钟获得变化时距的食物强化的鸽子,每秒能做出2~3次反应,连续反应长达15小时)。下面我们依据斯金纳的实验总结操作性条件作用的重要概念与规律。
1.强化与惩罚
强化是指通过操作行为结果以提升行为发生概率,而惩罚是指操作行为结果以降低行为发生概率。强化又分正强化与负强化,惩罚也分正惩罚与负惩罚。正与负的区分在于是向情境中增加某一刺激还是撤销某一刺激。比如妈妈想强化孩子积极做作业的行为,想要提升这一行为发生概率,既可以答应孩子按时做作业就可以吃一颗棒棒糖,这是在情境中加入了棒棒糖这一因素,所以是正强化,也可以答应孩子,如果按时做作业,晚上可以不用吃菠菜,菠菜是被从情境中撤销的刺激,所以是负强化。如果妈妈想降低姐姐打弟弟这一行为的发生概率,就要用惩罚,如果姐姐打了弟弟,妈妈就把姐姐关在屋子里面壁思过,则是正强化,因为加入了思过这一环节,如果妈妈不让姐姐看她最爱的动画片,则为负惩罚,因为把动画片这一刺激从环境里拿掉了。一般情况下,我们在做行为的塑造时,会同时使用强化与惩罚两种手段和方法。正的惩罚容易激发行为对象的消极情绪,故不提倡采用。
2.强化物(www.xing528.com)
所有能提升行为发生概率的事物就叫强化物。强化物可以分为初级强化物和次级强化物,初级强化物是指能够直接满足有机会生存需要的物品,比如食物、水等。次级强化物是指虽不有满足有机体的生物性需要,但由于与一级强化物反复联合,也具有强化性质的刺激。如金钱,对婴儿它不是强化物,但当小孩知道钱能换糖时,它就能对儿童的行为产生效果。再如分数,也是在受到教师的注意后才具有强化性质的。现在学习越来越网络化的情况下,一些网络学习的APP软件会设计一些强化物,比如斑马英语APP里会设置斑马币,学生完成学习任务,上传学习成果时,会奖励相应的虚拟斑马币,累积一定数量的斑马币之可以换购相应的玩具。网络游戏里也会时不时掉落宝藏以吸引玩家持续投入时间和精力,这些都属于次级强化物。赫尔提出的条件性强化物是次级强化物的一种,条件性强化是指一个中性刺激与一个强化刺激反复匹配联合,那么它也具备了强化的性质,比如在白鼠按压杠杆时,让灯光和食物同时出现,白鼠很快形成操作性条件反应,食物这一结果的出现提升了老鼠按压杠杆的行为发生概率。此后同时撤除灯光和食物,反应迅速消退。之后,白鼠按压杠杆,不给食物而仅呈现灯光,白鼠的压杆反应增加。这表明,灯光已具备强化性质。许多中性刺激都是由此而获得条件性强化的性质的。条件强化物的强化力量与相匹配的原始强化物的配对次数成正比。灯光与食物的匹配次数越多,灯光的强化作用便增加。如果某条件性强化物与许多一级强化物相匹配,那么该条件性强化物便具备了多方面的强化作用而成为一个概括性强化物。最典型的例子莫过于金钱了,由于它与衣、食、住、行等相联系、匹配,因而具有广泛的强化作用。斯金纳进一步指出,概括性强化物即使没有了赖以为基础的原始强化物相依随出现,效果也依然存在,有时候人类个体会为过于追求金钱也就可以理解了。
3.强化程序表
斯金纳箱最初设计的程序是固定强化的,即每按压一次标杆就有食物掉落到食盘中,这样老鼠按压杠杆的行为发生概率会稳步提升,在饥饿的时候就会按压杠杆。后来斯金纳开始设计一些强化程序的变式,如果间隔一段时间就给予食物而不管老鼠是否按压杠杆,老鼠的行为会有什么样的变化?如果老鼠按5次才给一次食物,老鼠是近更勤还是更懒?斯金纳进行了一系列的实验来研究这个部分,并将强化程序表归纳为以下四种。
(1)固定比率强化:即达到一次的反应次数就给予强化物,当每按压一次杠杆就给食物的情况下,强化比率为1。我们日常生活中的计件工资就固定比率强化表的应用,比如服装厂女工的工资发放,如果设计成每20件可以结一次工资,而每天工作9小时能完成20件的工作量,则能激发女工们工作9小时及以上。淘宝购物中满200要以减20元,以及唯品会设置的购物满298可以免邮费都会强化消费者的购买行为,拼命凑单,奶茶店满5送1活动也是典型的固定比率程序,强化比率为5。
(2)可变比率强化:即平均达到多少次反应次数就给予强化物,假如可变比率设计为5,则平均每5次反应里会有一次得到强化,但这一次强化会出现在第一次还是第5次是随机的。夹娃娃机、老虎机都是依据这一原理设计的,以确保玩家投进去的钱数少于得到的物品的价值来保证利润。但由于不知道强化物什么时候可以出现,会吸引玩家有更多的投入。
(3)固定间隔强化:即固定一段时间就给予强化物,而不是按老鼠的反应次数来给予强化,斯金纳发现在固定间隔强化的程序下,老鼠会在间隔时间中行为处于半消退状态,而只在给予强化物的时间产生行反应。同时,也在固定间隔强化情况下发现了迷信的鸽子,也用以解释人类的迷信行为:在本来没有因果关系的刺激之间建构了因果关系。淘宝双十一能达到好几个亿的销售额,就是利用了固定间隔,且间隔期为一年的强化程序鼓励了消费者的购买行为。大学的自习室到期末一座难求也反映了固定间隔的强化,期末考试的存在强化了学生的学习行为。
(4)可变间隔强化:即平均达到多长时间就给予强化物,但具体什么时候出现并不明确。教师不定期点名即反映了可变间隔强化,让学生每节课都保持一定的紧张度和参与度。
4.行为塑造
所谓塑造,就是通过小步反馈帮助学生达到目标。斯金纳认为“教育就是塑造行为”,如何通过强化去塑造行为,斯金纳采用连续接近的方法,对趋向于所要塑造的反应的方向不断地给予强化,直到引出所需要的新行为。例如,训练鸽子或老鼠头抬到一定的高度,只有当其头朝着实验所需的方向抬起来时才强化,下一次要求再多一点,直到全部达到所需的方向和高度。这时,新的行为就塑造成了。在课堂教学中,塑造是一个重要的工具。例如,学生要学习蛙泳动作,新手学一个完整的动作学起来特别困难。如果把这个动作分解成腿部动作、手部动作、换气,每次完成一个动作都进行强化,直到熟练再进行下一个动作。最后分解动作都熟练后再进行连贯练习,先是两个动作连贯,再三个动作连贯。在塑造行为时要注意这样一条原则:学生必须在他们能力所及的行为范围内得到强化,同时这些行为又必须能向新的行为延伸。动物园里的动物表演,能够依据饲养员的要求做出相应的动作,均来自于一步一步的行为强化塑造。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。