在他的自传里,斯金纳带着快乐的心情回忆说,他庆幸自己曾是个类似坏小子的人:“他们也许以为,心理学里面的某种东西正盯着我哩,可是,事实是,我想干什么就干什么,随心所欲。”斯金纳不听教授的训导,成了越来越彻底的行为主义者,在进行他的博士论文答辩时,人们请他列举对行为主义的一些反对意见,可他一条也想不出来。
斯金纳利用自己灵巧的机械能力做了一只迷箱,它比桑代克的样子改进了许多;从那以后,这种迷宫就广泛使用起来,并被人称为斯金纳箱。其基本的形式是——它有很多样——它是一只笼子,足以让一只白鼠很舒服地呆在里面,一面箱壁上有一根横杆,恰好装在一只小食盘和喷水口上面。老鼠在笼子里面爬来爬去,当它碰巧把前爪歇在横杆上压下它时,一粒饲料会自动地落在食盘里。笼子外面连接着的一些设备会画出一条线,一分钟一分钟地显示出压下横杆的总数,从而自动地记录老鼠的行为。这比桑代克的迷宫箱方法更为有效,更容易收集数据,因为实验人不需要盯着老鼠,也不需要在它压下横杆时递送饲料,而只需要看看记录就行了。
这只箱子还能得出更为客观的行为获取或者消失数据,这超过了当时任何人所能收集的数据。老鼠会决定,而且只由它决定,这次按下横杆和下次按下横杆的时间间隔是多大。斯金纳可以把他有关学习原理的发现建立在“反应频率”的基础上,即动物的行为按照强化程度而发生改变的频率,它不会受到实验人的行动的干扰。
另外,斯金纳还可以调节这只箱子,使其按各种方式来模仿现实世界里强化或者没有强化行为的许多情况。比如,他可以研究当动物定期受奖励时如何学会反应;已经学会的反应是如何在奖励突然中断时消失的;当奖励按照时间间隔(比如每按动四下来一次)间歇性地投放时,它是怎样影响学习和反应消除的;当奖励不定期投放时会有什么影响;按压横杆得出混合结果时(比如一次奖励跟着一次电击)会有什么影响,等等。在每种情况下,数据得出的曲线会显示在这各种情况之下行为的获取和消除频率。
斯金纳从这些曲线里形成了若干的原理,这些原理增进了人们对老鼠行为的理解,还有对人的行为的理解。有一个例子是,他发现部分强化有一个重要的变化效果。食物偶尔或者不定期投放,老鼠经计划训练后,会坚持不断地按压横杆,哪怕投放饲料的装置已经完全关掉了。它们学习的行为比一些在定期间歇投放的强化中训练出来的老鼠更不太容易消除。有人把这个比作在赌场玩老虎机的赌徒行为:老鼠和赌徒都没有办法预测下一次的强化什么时候到来,但是,因为习惯于偶尔得一些奖励,他们都会坚持不断地试下去,以期望在下一次尝试中得奖。
可是,斯金纳最为重要的贡献却是他的“操作性条件形成”,光是为这一点,他就值得在心理学的名誉大厅里享受一把永久的座椅。
在“经典的”(巴甫洛夫式的)条件形成中,动物对食物的非条件反应(分泌唾液)被变成对以前属于中性的刺激(节拍器或者铃铛的声音)的条件反射;行为改变的关键因素是新的刺激。
在“工具型”(桑代克式的)的条件形成中,行为变化的关键因素是反应,而不是刺激。中性的反应——在随机性的获取食物过程中碰巧踩在踏板上——被奖励食物,并成为学习得来的行为,它能够达到以前没有过的目的。
斯金纳的操作性条件形成是工具型条件形成的重要发展。动物为无论什么目的而进行的任何随机活动,都可以被看作以某种方式对环境的“操作,”因此,按斯金纳的说法,也可以是一个“操作动作”,奖励这个活动会产生操作条件形成。通过对一系列小型随机活动一个一个的奖励,实验者可以给动物的行为“定型”,直到它采取不是其本来的或者自然技能的一部分的行动。
下面这个例子,是斯金纳如何使一只鸽子的行为定型的,在一只斯金纳箱子里,与箱壁齐平的地方放着一块彩色的小塑料圆盘,他要让鸽子啄那个盘子:
我们首先在鸽子从箱子里面的任何地点朝这个点(即盘子)的方向稍稍转动身体的时候给它喂食。这会增加这种行为的频率。然后,我们不再强化奖励,直到有朝这个方向稍稍的转动为止。这又一次在没有产生新的单元的情况下改变了行为的普通分配。接着,我们继续在它越来越靠近这个点的时候进行强化,然后只在它的头朝这个点轻轻移动时强化,最后,只在它的头实际上碰到这个点时才给奖励。
按照这个方法,我们可以建立复杂的操作动作,否则,它是这种有机体的全部技能里永远也不可能出现的。通过强化一系列连续的靠近动作,我们可以在很短的时间内得出对某个非常高的机率的罕见的反应……从箱子任何一个地点向这个点的转动,向它走近,抬起头来,和向这个点啄动的全套动作,看起来就好像是行为大生的功能单元,可是,它是由一个连续的区别性强化过程在无区别性的行为中建立起来的。
(其它一些实验人利用斯金纳的技巧建立起了奇特得多的行为。有人教会一只兔子捡起一枚硬币含在口里,然后扔进一只小猪聚钱盒里。还有人教会一头名叫普里西拉的猪打开电视,捡起脏衣服并扔进一只大蓝子里去,还用吸尘器吸地。)
斯金纳把对其鸽子的操作训练比作孩子学会说话、唱歌、玩游戏和在一定的时候学会一切的成年行为。在他看来,所有的一切都是由于利用操作性条件形成,把一些简单行为的细小连接点连接起来的一长串行为的集合。人们不妨把它叫做对人类(直立人?)行为的勃起肌组现——即一个没有意识的机器人,由从无数没有意义的小单位中得出来的操作性条件形成组合而成。
斯金纳在相当长的时间内多少受到心理学机构的冷落,可终于慢慢赢得了一些专心于此的人——其结果最终足以导致4本斯金纳行为主义者研究日记和学说的出版,并在美国心理学协会专门设了一个斯金纳型研究部(第25部:行为实验分析部),目前有1000多成员,或者约为总成员的百分之一点五。斯金纳箱和操作条件形成技巧自此以后一直为实验心理学家们所使用。最近几年,斯金纳的名字和工作在每年的社会科学出版物上被引用好几百次(虽然只有弗洛伊德的七分之一)。
可是,斯金纳的主要影响仍然是在主流心理学之外。
斯金纳1953年有一次去他女儿的学校参观,这时,他突然想到,与他教鸽子弹钢琴类似的一些操作性技巧,可能是比传统的方法更为有效的教学法。复杂的课题可以按逻辑顺序细分为简单的步骤;学生会被问到一些问题,并立即告知答案是否正确。这里可能会有两个原理起作用:学生答对了的知识是一种很有力量的行为强化(奖励),而立即强化会比延迟强化效果好些。结果就是有名的“控制教学法”。
可是,因为一名教师不可能同时给一教室的学生提供强化,因此必须编写新的教科书,里面一对一对地列一些问题和答案,每个问题都向对课题的总体把握迈出一小步,而且,可以让学生通过合上课本上的答案而立即奖励自己。斯金纳还开发出了一种教学机器,用于通过可比的手段进行操作性自我教学。这种机械模型当时红火了一阵子,然后没有人使用了,可是,今天,以计算机为基础,带有立即强化的自我教学法又在快速发展了。
有一些年,控制学习运动对教学法产生了很大的影响,设计用来通过操作性条件形成进行教学的课程和备课材料广泛使用,美国相当多的中学和大学,以及十几个国家的许多学校都使用这种方法。可最终,教育者们认识到,控制教学的细分法只提供了人类所需知识的一部分,他们还需要完整和有层次的思想结构。而且,以后的研究显示,在人类当中,延迟的强化经常比立即强化有更好的结果,思考别人的反应可能会导致比立即反应和得到答案更多些的学习。最后,观察别人的行为,尽管对猫不一定是有效的,可对人却是一种非常有效的学习形式,而且它不牵涉到立即强化。不管怎样,斯金纳关于立即强化的教条证明是有用的,而且为大多数教师所熟悉,并被溶入许多教程和中学教科书中去了。
斯金纳对一些精神和情感疾病的治疗还起过不小的作用。他曾想到,通过对病人从病态行为向正常行为些微转化的奖励,说不定可以使病人的行为重新定型。他和两位研究生从40年代开始进行了首次实验尝试,后来叫做行为修正法。他们在波士顿附近的州立医院搭了一些按压横杆台,如果病人按照有顺序的方式操作机器,他们就会得到一些糖果或者香烟奖励。一旦实现这个目标,治疗师就给他们一些象征物,以奖励精神病人的合适行为,比如自愿进食,自我修整,并协助进行房间整理工作等。这些象征物可以换糖果、香烟,也可以换一些特权,如选择进餐的隔间,与医生交谈,或者看电视。
在深度偏执的精神病人当中奖励期望得到的行为经常能够奏效。一位压抑的妇女不愿吃饭,还有饿死的危险,可是,她喜欢探访者,还喜欢电视机、收音机、书籍和杂志以及鲜花摆在她房间里。治疗师把她移到一间没有这些东西的病房里,并把一份便餐放在她面前;她只要吃下任何一点点东西,其中的一些享受品便临时给她恢复过来。