来自《第二章 激进的行为主义》 P31
行为的实验分析
通过系统观察行为并操纵其周围的环境变量,斯金纳开始探索支配学习的定律。他把学习界定为行为的或多或少的持久变化,这一变化能通过在一段时间内观察有机体而觉察出来。例如,假设某一组织的办公室主任每天登录一次办公室的内部网,过了一段时间后,她浏览电子邮件的行为频率增加到每半小时左右一次。从对其行为的观察中,可以认为,办公室主任已习得了有规律地经常浏览电子邮件。
(一)应答行为与操作行为
斯金纳区分了两类行为:应答行为和操作行为,后一种行为吸引了他大部分注意。应答行为由巴甫洛夫在其著名的经典条件作用实验中进行了研究,是指因对刺数做出反应而不由自主引出的行为。巴甫洛夫的狗看见食物就分泌唾液就是一例。又如儿童对很响的噪音的惊吓反应。相比之下,操作行为是只由有机体做出的行为。斯金纳认为所有的有机体都有内在的主动性,可做出作用于其环境的反应。大多数行为就是这种类型,小鸟在草从中啄食昆虫,马戏团的动物在马戏场上表演,学生在课堂上举手,这些都是操作行为的例子
(二)强化的相依性
为理解为什么某些操作行为表现了出来而其他的则没有表现出来,斯金纳认为应在行为与其周围环境事件的关系中来看待行为。也就是说,我们应当查看行为的先行刺激与后果。虽然先行刺激设置了反应的情境,但反应是否会再次出现,其决定性的因素是反应的后果。例如如果一只狗的鼻子凑近蜂巢去嗅却被蜇了一下,那么,可以肯定,狗对于重复这一行为是很害怕的。于是,斯金纳提出了如下的S-R-S基本关系:
S —— R —— S
(辨别刺激) (操作反应) (相依刺激)
这一关系提供了导出所有操作学习定律的框架。由于相依刺激的性质决定了对反应的影响(或者受到强化,或者消失),斯金纳便将这一学习原理称为强化的相依性(Skinner, 1969)。
强化这一概念是斯金纳行为主义的核心,最初是由桑代克以效果律的形式提出的:
当在某一单一情境与某一反应之间建立了可修改的联系并伴随满意的结果时,联系的强度就增强。当形成这一联系并伴有令人憤怒的后果时,其强度就受到削弱。(1913,p.4)
简单讲,如果行为受到奖励或强化,它就更有可能再次发生。同样,如果某一反应的后果令人讨厌,则该反应不大可能再次发生。这样,为理解学习,我们必须寻找已发生的行为变化并决定什么样的行为后果导致了这一变化。例如,在狗的例子中,将鼻子凑近蜂巢去嗅的后果是令其讨厌的,因而它就学会了不再那样做。
「I,重述知识」行为的试验分析——简述应答行为和操作行为,以及强化相依性原理。
【I——@老牛老刘解读】抛开专家的理论和观点,我更想把“应答行为”和“操作行为”类比为另外两个我们比较熟悉的词来解读:“下意识反应”和“习惯性动作”。举个例子,就比如说我们的运动员,经过长年累月的训练他们的运动神经比我们普通人是要发达的。比如我们平时走不平整的路一不小心就会失去平衡或者崴脚或者摔倒,但运动员面对同样的状况就会下意识的让身体保持平衡,保持自己身体稳定。下意识的就是不经过大脑思考不由自主就做出的行为,也就是文中提到的“应答行为”。那习惯动作又是什么呢,还说运动员,运动员从小从事某一个项目的训练,固定的场地,固定的动作要领等等,也就导致只要他们出现在训练场或者赛场的时候,就会去使用他们学习一系列技能,这个反应是后天培养出来的,是由外部指向的刺激的,这个就是“操作行为”。
那强化性原理又是什么呢?我们还是回到运动员的训练,在训练中,做得好的动作,教练会鼓励,比赛胜利会有奖励,那对于运动员来讲他就会持续的强化这个动作越做越好;相反,如果动作做的不好,被教练骂,取得不了好的成绩,这个动作慢慢改掉最后就会不再出现。所以强化性原理就是指人们面对某一种改变刺激时,做出相应反应,如果结果是好的,就会强化保留,如果结果不好就会逐渐削弱。
来自《第二章 激进的行为主义》 P34
增强反应:正强化
正强化是指相依于某一反应的强化物(满意的刺激)导致了该反应的增强。正强化的几个例子已经讨论过了。收到电子邮件强化了办公室主任对内部网的使用。表扬和放假强化了约翰逊每天完成擦地板任务的行为。在课堂上,在家中,在社会情境中或在工作中,可很容易地观察到正强化的其他例子。例如,训狗师用狗喜欢吃的食物强化狗的“注意”行为;雇主用支付奖金的形式强化雇员在装配线上超额完成工作的行为;我用巧克力强化我丈夫每周清洁浴缸的行为。但所有这些例子提出的一个问题是,到底什么可以作为强化物?对给定情境,我们如何决定选择哪个强化物?
(1)强化物的类型。初级强化物的强化价值是在生物学上决定了的(图2.3)。例如,食物是所有活着的有机体生物学上的需要,饥饿的动物会表现出各类行为来得到食物。在著名的斯金纳箱( Skinner,1938)中,被剥夺食物的白鼠学会了按压杠杆以便带动食盒放出小的食丸来。虽然初级强化在人类的学习中并不起广泛作用,但已证实它在某些情况下非常有用。沃尔夫里斯利和米斯(wolf, Risley,&.Mes,1964)报告了使用几份食物来强化一名自闭症男孩戴眼镜的行为。
在解释人类学习时更重要的是条件强化物的概念。条件强化物是那些通过与初级强化物相联系而获得强化价值的刺激。这样,它们通过条件化而具有了强化作用。条件强化物的例子包括金星、钱和表扬。表扬是一种特殊类型的条件强化物,因为它不像钱或棒球卡那样是可以储存起来或用来兑换的有形的东西。因此,它被称为是社会强化物,并已证实对人类的行为有巨大影响。例如,路德维格和梅赫( Ludwig Machr,1967)证实,在体育课上对学生的行为表现做简单的表扬,结果学生对自己做出许多更积极的评价。同样,心理学学者发现,当杂货店的收银员对顾客说“请记住系上安全带。要知道[商店名]也关注你们的安全”,则安全带的使用率戏剧性地增加了(J. Bailey,个人交流)。
(2)强化物的相对性。在回顾正强化影响行为的条件时,普雷马克(D.Prehack,1959)证实,学习者已有极大兴趣从事的行为可被用来强化低频率的行为。这种将高频率的行为相依于低频率的行为以便强化低频率行为的程序被称为普雷马克原理,它只是一种正强化并被父母们在很多地方成功运用。“只要你做完家庭作业(低频率行为),你就可以看电视(高频率行为)”。
(3)选择强化物。普雷马克原理很好地说明了需要观察学习者以便决定哪种强化物可能是最有效的。在普雷马克原理中,存在一种选择强化物的经验基础:起强化作用的行为是观察到的学习者经常表现出的行为。在其他情况下,这通常是一个在所观察到的行为基础上进行合理猜测的问题。年幼的儿童看来喜欢彩色的张贴画;当给予机会时,士兵喜欢离开军营;许多成人看起来努力工作,或者去完成额外的工作,其目的是为了挣更多钱。这些都有可能起到有效强化物的作用,但只有选择一种——不管哪一种,只要看来最适合于给定的学习者及所强化的行为并应用它,才能有把握地确定其效果。如果它起作用,就使用它,如果它不起作用,就换另一种。
(4)引出已习得的行为。有时,只有当以某种方式引出习得的行为时,这一行为才能表现出来,并能对其进行强化。办公室主任的例子就是一个很好的例子。虽然她阅读了发给她的电子邮件,而且在培训期间已学会了如何发送电子邮件,但她并未发送任何电子邮件。为引发她的适当反应,部门经理从另一个地方给办公室主任发了一封电子邮件,要求立即回复。这就是辨别刺激。由于只能通过电子邮件来回复,办公室主任就回了一封信,提供了所要求的信息。她的反应很快被部门经理的如下回复所强化:“谢谢你提供的信息,很有帮助!”
「I,重述知识」选择强化物的元素
「A1,激活经验」过去的强化实例。课程中,用获得积分从而获得奖品的方式,激发学习者发言。生活中,在家里公开表扬孩子,强化孩子承担洗碗的行为。请回顾你工作中或者生活中类似的例子,写出一个实例,并结合你的「I便签」,对这个例子中的强化物进行分析。
【I——@老牛老刘解读】强化物换句话说就是正向激励,做了这个动作或者提供者这个事物能让学习行为正向的改变并得到加强。它包含四个要素。
(1)强化物有分类,基于对方的需求有不同的类型。可以结合马斯洛的需求层次理论来理解:生理需求、安全需求、社交需求、尊重需求和自我实现需要。所以表扬是自我实现层面的,属于最高层的,温饱等属于生理需要,属于最基本的。
(2)强化物之间有相对性。比如高频行为可以作为低频行为的强化物。只要你完成作业,就可以出去玩。
(3)强化物不是普适,因人而异,因此要激励到别人平时就要注意观察对方。
(4)强化的前提也要有实践之地。不去用只能说知道,只有做了结合强化效果才能越做越好。
我之前有计划减肥的行动,第一步就是改善饮食习惯,中午吃代餐沙拉。强化物是深层次尊重层面的,我瘦下来就可以逛商场时可以不受体型约束买自己喜欢的衣服。在坚持吃的阶段,心里会有松懈,结合健身教练的指导,强化是“你只有每周坚持吃6天沙拉,周末才可以放开吃一次”的高频刺激低频的做法。
之前还是有一段时间吃完就停了没坚持下去,也有些客观原因比如公司合作的供应商解约了不能刷饭卡,自己花钱买舍不得之类的。看完这个片段我觉得问题出在强化动作的持续观察方面,因为状况时时都会改变。最开始每天称体重看到体重下降就是一种动作强化。但是到了瓶颈期坚持吃也没瘦,就退缩了,这时候如果引入新的激励强化方法,可能还会继续坚持,比如给自己配一个喜欢吃的水果或其他无负担的自己平时就喜欢的食物,每次吃沙拉就可以一起吃一个这个东西,也许也会有用。所以强化物要动态跟踪不能一成不变。