第二节 强化物及影响因素
一、强化物
从上一节对强化原理的描述中我们了解到,强化物是一个后知后觉的,必得于实践中验证并经过实践所证实的概念。它包含两层含义:第一,作为强化物的事件(物、关系或者机会等等)必须发生在目标行为之后(相对紧随);第二,这样的前后相随的序贯联系在一段时间内必使目标行为增加,而非不变,更不能减少。
强化物既然是后知后觉的概念,就应当与一般意义上的奖励有所区别。奖励在一般意义上有强化的功效,因为它往往发生在特定的目标行为(或作为这种行为所产出的结果)之后,一般地讲,也能激励着被奖励的目标行为继续出现或者增加。但是奖励并不必然地等同于强化,其理解如下。
第一,奖励往往是施予者认为行为者应该喜闻乐见、恨不能多的物质、关系或者机会等等,但是,两者有时候对应得并不那么贴切。而强化物是不仅给予而且还要看在一段时间内这种给予的行为事件是否增加了预期的行为。如果作为奖励的给予行为不仅没有带来行为的增加,反而有所减少,甚至消退了预期行为,或者短期内看似有所增加,但放远一点来看,实际上还是减少或者消退了预期行为,那么,所给予的奖励就不能认为是强化物,甚至应当看作是惩罚物。比如,多发工资看似是一种奖励认真工作、忠于公司的行为途径,但结果有可能是员工们都争着跳槽去工资稍微少一点但其他方面更有吸引力的公司,守在这个公司的员工也不踏实,给的钱越多,讨价还价的胃口越大,干出的实事越少。
第二,强化物是动态的后验概念,而奖励往往是静态的先占概念。对于维持必要的目标行为而言,强化物不是一个一成不变的事件,它随着消费的情况而自动地增强或者减弱它的效能,因此,为了维持一个必要的目标行为,需要对强化物进行及时的甚至是实时的评估;而奖励往往是先前就预设的,并且一以贯之按标准执行的。
第三,与奖励相反的惩罚概念有时候反而可以作为强化物起作用。比如,我们一般认为批评是一种惩罚(注意这里是通用语义上的惩罚概念,而不是后面提到的作为行为原理的惩罚概念),但事实上正是老师每每对一个上课做小动作的学生的批评造成了他课堂上的小动作越来越多。
所以,当我们希望增加某预期行为而强化它时,一定要警惕一般语义上的奖励与行为分析领域中的强化物的区别和联系,尤其是当我们认为已经足够地奖励了某预期行为却不见奖励的后果时,更要反思,所给予的奖励措施还是不是强化物,如果是,它的效能如何。
二、影响强化物的因素 影响强化物效能的因素包括哪些?
强化物的效能取决于下述几个原则:依从原则、即时原则、匹配原则、剥夺原则。
(一)依从原则
依从原则中的所谓依从,指的是在而且仅在预期行为出现以后才给予强化物。在给予强化物之前,应当确保没有其他非预期性行为发生。如果不管预期行为发生与否,都可以随时获得强化物,那么,预期行为也会减少,甚至消失。所以,违反了依从原则,强化物的效能就会大打折扣,甚至不能再称其为强化物。 举一个简单的例子来说明这个原则。假设妈妈希望通过满足儿童玩一会儿喜欢的网络游戏来强化他按时完成作业的行为,但是这个孩子在现实中可以有多种途径获得这种满足:他可以自己偷偷上网而不被发现;他可以通过向爸爸说一些讨好的话而获得;他甚至可以通过威胁姥姥获得这样的机会又不被举报等等。也就是说获得一段时间的上网机会并不依从于目标行为(按时完成作业)的出现。那么,可以想见,妈妈的这个策略在实际实施中可能会打折扣,甚至受阻,或者压根不能成功。 同理,我们可以通过故意地违反这个原则达到减少或者消退问题行为的目的。在问题行为管理中有一个原理,叫做非依从于条件和机会的强化(NCR),就是不管问题行为发生与否,都按特定程序给予强化物,结果问题行为就会减少。 如何判断依从原则是否体现在某特殊强化事件中呢?可以通过问“该事件是否仅在预期行为之后出现”来检测。如果该事件是而且仅仅是在某预期行为之后出现,那么这个强化物事件就符合了依从原则,否则,就必然地违反了这一原则。
(二)即时原则
所谓即时原则,指的是在预期行为出现后立即给予强化物,越快越好。有两个例外的情况。 ·如果立即给予某信号,代表延迟的强化物(比如,一个图章、贴画等等,前提是孩子能够了解该信号与延迟强化物的关系,比如不等数量获得的贴画可以“买”到不等数量的心仪的东西);实际上说的是代币系统的建立。 ·如果行为者可以描述行为与延迟的强化物之间的关系(比如工作与工资)。 即时原则的效用是显然的。如果我们鼓励孩子用言语表达其意愿或要求,则要尽量在其表达之后的最短时间内满足其意愿或者要求,稍事迟疑,儿童可能用的就不再是言语,而是情绪(不分场合的叫喊哭闹,甚至是指向自己或者他人的攻击性言语或行为)。如果此时再给予强化物(满足其心愿或者要求),强化的就不再是合理的表达要求的行为,而是问题的表达行为了。满足要趁早,否则就没有机会了,说的也是这个道理。
(三)匹配原则
匹配原则指的是分配的强化物与行为的努力和复杂程度成正比,不多不少,物有所值。一般地说,考量匹配原则可以从行为和强化物两个角度去衡量。从行为的角度衡量,是看该行为是新学习的行为还是已掌握的行为,行为的持续时间长短、复杂程度、需要付出努力的程度等等;从强化物的角度衡量,包括强化物的大小、渴求程度、消费该强化物的时间等因素。如果行为和紧随其后的强化物是匹配的,则行为就容易习得和维持;不匹配则容易造成目标行为学习的困难和挫折(强化物微不足道,而行为需要付出的努力太大),或者是强化物难以为继(强化物很强,但目标行为所需要付出的努力却很轻微)的局面。 在对儿童的日常管理教育中,经常会出现强化物与行为的努力程度不匹配的状况。比如,为了让孩子写作业,动不动就提出奖赏他一个游戏机或者掌上电脑。从一时的效果来看,他可能会有积极主动写作业的行为,但持续获得这样的强化物显然难以为继。同理,如果儿童好不容易写完了作业,却只得到了一片薯片或者半片山楂片,他也很难继续维持努力写作业的行为。
(四)满足与剥夺原理
满足指的是行为者最近有没有接受强化物,越近接受强化物,就越容易满足。剥夺指的是行为者离上一次接受强化物已经有多长时间,时间越久,剥夺越明显。所谓剥夺原理反映的是这样一种现象,即被剥夺强化物的时间越长,强化物效能越大。 剥夺原理告诉我们,要让一个强化物保持其效能,那它就不可以随时轻易获得。也就是说,强化物应该在日常背景下处于被管理的状态。在现实生活中,用强化物增强预期行为是很多家长和专业人员可以想到并能做到的策略,但有意识地管理儿童的强化物,却是稀有罕见的个案。从这个基本的事实出发,至少可以部分地解释为什么大家都在用强化的策略,却不见得人人成功,甚至很多人彻底失败而不得不借助于惩罚或者强制措施。 剥夺原理提示把强化物管理起来至关重要。如何管理强化物呢? 在阐述强化物的管理策略之前,有必要解释一下,此处提到的强化物与之前和之后讨论的强化物的概念略有不同。这里提到的强化物或者可以准确地称之为备选强化物,它们往往是孩子喜闻乐见的物质(如饮料或食品)、活动(如电视、游戏、运动等)、机会或特权(如优先权等)。它们最有可能但不必然是促进某行为的强化物。 管理强化物的策略有两个:空间管理和时间管理。
空间管理:把儿童喜闻乐见的物质强化物分门别类地收集整理在专门的柜子里(可以是透明且放置于明处的,也可以是隐藏在某处的),交代所有与儿童相关的其他家庭成员或者照护人员,这些东西在什么样的情况下可以用来满足儿童。在训练中或者在特殊目标行为执行的过程中,儿童才有可能接触到这些强化物;在其他任何时候,他们都应当没有机会再接触。
时间管理:儿童喜闻乐见的活动或者机会的强化物可以采用时间管理的策略。也就是说,当儿童出现目标行为之后,才可以有机会获得一段时间的(具体因人而异,可以一分钟、五分钟、半小时,或者一小时以及以上)接触某个活动或者享受某个特权的机会。而其他任何时间,他都没有可能接近这些活动或特权的机会。
管理强化物的前提是首先要知道哪些可能是强化物,以及哪个可能是最有效能的强化物。 如何了解并收集评估儿童的强化物呢?有如下几个策略。 (1)清单列举法。根据回忆中孩子对某物或活动或机会喜好的程度,分门别类地列举每一个门类的前五样东西,比如零食、饮料、玩具、活动、游戏等等。 (2)配对比较法。将清单中物质的(包括玩具)强化物分别两两配对,将每一配对随机地呈现在儿童面前让他选择并消费(吃掉、喝掉或者玩一段时间)。当所有配对都一一呈现以后,就可以得出每一个备选强化物被选择的频率多少,被选择频次多者可能的效能越大。 (3)顺次选择法。
将清单中物质性的强化物一字排开,让儿童在一个相对等距的位置出发,去获得他最心仪的强化物。依次选择,直到全部选完或者表示不想继续选择。此法又可以分为两种操作策略,一种是补充被消费掉的选择,即消费掉的强化物再被补充到选择库中,与其他备选强化物获得同样的被选择机会,重新待选。一种是不补充被消费掉的强化物,某种强化物一旦被选择,就从备选库中撤掉,没有再被选择的机会。经过数轮次这样的选择试验,按照每一种强化物被选择的顺序号码取平均值,得数越低者,可能的效能越大。 除了上述原则需要考虑以外,还有一些因素在实际训练中也要着重考虑,他们是:容易分配(如果半天找不着或者拿不出,势必影响训练);价格低廉(强化频度太大、价格昂贵的强化物用的时间久了,经济上吃不消);不容易通过其他途径获得(比如强化物处于未被管理的状态,则儿童随时随地都有接近或获得的可能);不产生与预期行为相竞争的行为(比如用嚼口香糖奖励发音)。