加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

桑代克的猫和斯金纳的老鼠(2

(2008-09-04 22:14:33)
标签:

杂谈

分类: 研究方法及理论
桑代克的猫和斯金纳的老鼠(2)

身边的心理学 作者:亚当·喀什(Adam Cash) 2008-06-23 09:40

    但是所有的强化物都是这样吗?所有的强化物效果都一样吗?如果老鼠每次按压杠杆斯金纳都给它5美元,老鼠还能学会同样的反应吗?很可能不会。强化物不同,对反应的影响也不同。不是所有的东西都能达到奖赏或者强化的效果。

 

两种有效的正强化是:

 

原强化物:无需塑造过程或者提前培训就能发挥作用的奖赏物。可以是食物,也可以是愉悦的身体体验。大卫·普里马克在1971年提出一个很有意思的观点,他说,观察人们大部分时间里所做的事情,就可以找出他的原强化物。如果他们花很多时间看电视、骑自行车或者睡觉,这些活动就是他们的原强化物。他的普里马克原则说明,可能性很高的反应可以用来强化可能性较低的反应,即高频的活动作为低频活动的强化物。这就像用冰激凌来让孩子吃蔬菜。如果他们想要冰激凌(高可能性的反应),他们就得吃蔬菜(低可能性的反应)

 

次级强化物:是通过学习和经验得以强化的事物。应用经典条件反射(见第8章)的原理,把次级强化物与原强化物相联系,同样可以出现期望的反应。海豚训练员在给海豚喂鱼时吹响口哨。最后,由于海豚把口哨和食物相联系,口哨可以单独作为强化物。但是也有人提出质疑说,按照大卫·利波曼的观点,口哨只是一个信号,不能替代食物。目前这个问题仍然没有定论。当我们找出可以强化某人或者某事的事物时,我们就可以着手通过奖赏来影响对方,使其表现出期望的反应。比如,一个办公室管理人员总是很难在午饭后让他的手下按时回来工作。怎么办?首先,她得找出这群人或者每一个人的强化物。然后,她要奖赏每一个达到她所期待的行为、能够按时回来工作的人,可以给他们小礼物、钱或者画着笑脸的贴纸。

 

我们先回到负强化上来。很多人不明白这个问题。拿走某种东西或者取消不良刺激如何能够增加行为出现的可能性?你家里是不是曾经有条小狗,你想睡觉,它却不停地嗥叫?如果你把它关在另一个屋子里或者车库里,因为它还是叫,所以你很可能还得再起来看看怎么回事。当你看见它的时候,它不叫了。然后你回去睡觉,但是我保证10分钟后你又被吵醒了。出现这样的问题是因为你的行为是在负强化的控制之下。狗叫是很可恶(很烦人)的刺激。你去了车库,它就不叫了,这就增加了每次狗叫你就去车库的可能性。你受到了负强化,不断地去车库——而你的狗则受到了正强化,不断地嗥叫。谁在控制情境,你,还是狗?在办公室经理那个例子中,每次员工午餐后回去晚了老板都冲他们吼叫,他们可能为了不挨骂开始准时回去上班。这也是一个负强化的例子。

 

强化的时机  如果办公室经理一直等到年底公司圣诞节派对时,才强化员工按时工作的行为,那会怎么样?那些曾经不按时工作的事情都将被忘在脑后,只忙着接受圣诞礼物,这时候的强化没有丝毫效果。格赖斯(GRGrice)和斯彭斯(KWSpence)指出,强化必须立即实施,或者尽快实施,才能收到期望的反应。如果等得太久,反应和强化结果的联系就消失了。如果桑代克给猫的奖赏是一张购物券,在下次游览猫粮大观时才能兑现,恐怕这只猫永远也不可能逃出那个迷笼。坏老鼠!坏极了!

 

正强化和负强化的结果都是增加某种行为的可能。但是其他结果呢?比如惩罚?惩罚是要减少某种反应出现的可能性。一种惩罚是直接的——引入某种令人厌恶或者反感的东西。另一种惩罚,负惩罚,是减少某种强化,比如拿走孩子的自行车。我们总是使用惩罚来影响人们的行为。强化例子中的办公室经理也可以惩罚那些上班迟到的员工。父母惩罚孩子,法院惩罚罪犯。信用卡公司惩罚那些拖欠付款的人。惩罚随处可见。我知道很多人都使用惩罚。我也知道人们总是批评刚为父母的人,说他们从不惩罚孩子的坏行为。“那孩子缺顿好打。”现代的父母有时候辩驳说惩罚不起作用。是这样吗?惩罚事实上是一种非常有力的压制某种行为的方法,但是请记住几个原则。惩罚应该是用尽可能强度最小的方式来促成期望出现的反应行为但是,惩罚不能够太轻,因为如果你想一点一点地增加强度,接受方可能会习惯、会适应,从而使每一次强度的增加都不起作用。太大强度的惩罚也有问题。为了让惩罚长期有效,你必须留出余地,逐渐增加强度。为了使惩罚有效,惩罚必须及时,要尽可能在时间上与被惩罚的行为接近。如果我等了三周才惩罚我的孩子打碎灯的行为,他们可能一头雾水,根本不知道我为什么惩罚他们。这时,无论你怎么做,惩罚都不起作用。惩罚应该坚定、坚持,并且在惩罚的同时要清楚地让对方知道惩罚的原因。当然,为了改变自己的行为而给其他人带来折磨或者痛苦,很多人不喜欢这样的做法。使用惩罚也有弊端:可能导致恐惧。当惩罚对某些人产生了效果,他们可能会因为预料到将来的惩罚,从而产生严重的焦虑情绪,就像等着另一只鞋掉下来。这有可能给他们的生活造成破坏性影响,有时导致逃避和冷漠。攻击性是惩罚的另一个负面结果。我在监狱和拘留所都工作过,我看到那里有人变得易怒,更具攻击性,甚至对监禁中所面对的严厉的管束感到恐惧。当他们被释放,可以以新的面貌面对世界时,他们已经不能适应,变得非常刻板,常常不能从监狱过渡到外面的世界。行为消失如果在成功地增加了行为出现的频率后,我突然撤销强化,会发生什么事?行为最终会消失,具体时间取决于之前强化的频率。我保证如果不发工资,很可能用不了多长时间,我的工作行为就会停止。这叫做消退,强化撤销后行为停止。就像惩罚一样,消退也是一种方法,可以阻止行为再次发生。第8章对消退有更多的介绍。强化程序你有没有想过,为什么有些人一次次地到拉斯韦加斯或者亚特兰大这样的地方去花钱赌博?赌博的结果是,卡西诺赌场成了最大的赢家。但人们就是不愿离开。上次我在拉斯韦加斯时,在卡西诺价值数百万的别墅和度假村里过得非常愉快。我猜我能有这样的享受,全是赌徒们的功劳。人们禁不住再次回来是因为某种叫做强化程序的东西,一个时间表或者是一个定势——关于什么样的反应受到强化和在什么时间进行强化。

 

有四种不同的强化时间安排,每一种都可以对行为产生不同的效果。

固定时间间隔

不固定时间间隔

固定比率间隔

不固定比率间隔

最常见的强化形式是持续强化。每一次行为出现时都进行强化。每一次我拉动自动售卖机的把手,我就赢!我是这么期望的。持续强化有助于塑造学习的过程,也对获得阶段有好处。每次我学习一个新的行为,都要花一定的时间。持续强化可以帮助我学得更快。但是,持续强化的问题是,它消失得也快。如果我们每次午饭后按时回去工作都受到强化,那么老板一旦停止强化,我就立即会恢复原来的行为。但是,大部分的强化都是间断的、偶发的。当然,我们不可能每次拉动自动售卖机的把手时都能有奖。斯金纳没有设计过自动售卖机;卡西诺的行为主义心理学家洛瑟(BALoser)设计了这种装置。低频率的强化称作部分强化

 

有两种部分强化程序,按照强化出现的可预见性或者偶然性,每一种部分强化程序又被进一步地分类。第一种部分强化又称比率强化程序。只在出现了特定数量的反应时才给予强化。如果父母对孩子采用这种强化,可能是在孩子得了一定数量的A或者打扫房间达到一定的次数之后。

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有