如果说斯坦福-比奈标准没有能够将这些恳请变成现实的话,很幸运的是,它也没有能够将特曼将它用作优生学办法的想法变成现实:
可以放心地预测,在最近的将来,智力测试将会把成千上万的……高级低能儿置于社会的看管和保护之下。最终,它就会得出一个美妙的结果,使低能者不会继续繁殖下去,也杜绝了庞大数量的犯罪、赤贫和工业低效率。
出版于1916的斯坦福-比奈标准立即成为,并在后来的二十多年时间内一直是,测量智力的标准试题。后来,它还在一系列学校、预习学校、大学及各种机构里成为低能者的测试办法。可是,其影响远非仅止于此,它会在更广泛的范围和更深刻的意义上产生影响;斯坦福-比奈标准测试法(及其后来的1937版)成了后来兴起的几乎所有智商测定法的标准。比奈、西蒙和特曼认为是构成智力的主要元素的一些特点,成了后来几乎所有的智力测验的模式;这些元素包括记忆力、语言理解力、词汇量大小、眼手协调能力、对熟悉事物的知识、判断不合理事物的能力、思想联想的速度及丰富性以及其它一些能力特点。
后来按照斯坦福-比奈标准元素进行的一项测试,在智力测试的领域里掀起了一场革命。
几乎所有的比奈标准版——后来到了十几种之多——都得由一位心理学家或者受过培训的专业人员一次对一个人进行测试。可是,集体测试,即受试者自己阅读试卷,然后在多重选择题上选择答案,或者在表格上做一些合适的标记,操作起来将会更快些,简单些,也便宜得多。
在心理测量上作出的这项突破,是因为美国卷入第一次世界大战引起的。伍德罗·威尔逊总统于1917年4月6日签署作战宣言两周后,美国心理学协会指定了一个委员会,专门研究心理学可以为战争做哪些服务。这个委员会报告说,这门专业能够为战争作出的最为有用的贡献,不过是设计一套心理学测试办法,以快速地检查大批的军事人员,清除掉心理不健全和能力不足的人,按军事人员的能力分成类别,把最合适做特种培训和责任重大工作的人挑选出来。
一组心理学家——其中有特曼、哥达德和哈佛教授罗伯特·耶基斯——汇集在葡萄园,开始设计这套试题。8月份,耶基斯被任命为陆军少校,并受命执行该计划。他汇集了约40名心理学家,在两个月时间内拿出了“陆军阿尔法方案”,即书面智力测试题和“陆军贝塔方案”,为应召士兵中百分之四十识字不多的士兵设计的图画测试题(做贝塔题的试题要求由助手大声念出来)。从今天的观点来看,广泛使用的阿尔法方案看上去像是一个奇怪的混合物,里面是科学常识、民间智慧和道德观念的总汇,如下例所示:
1.如果植物因为没有雨水快要干死了,你应该
——给它们浇水,
——征求花匠的意见,
——在旁边施化肥。
8.宁可战斗而不逃跑,因为
——懦夫常常被打死,
——战死更光荣,
——如果逃跑,可能背后挨子弹。
11.回声的起因是
——声波的反射,
——空气中有电子,
——空气中有湿气。
耶基斯的小组开始在4个军营中进行测试,可是,在几个星期内,总军医决定在全军实施该方案;到战争结束时,即1918年11月,有170万人接受了这些测试,耶基斯手下约300名心理学家给每个人都打了分,并为他推荐了合适的军事任务。尽管耶基斯的心理学家队伍遇到了职业军官们的抵抗和不配合,但这些测试结果使约8000人因为不适合岗位而被撤换下来,并有约10000低智力水平的人被分配到劳动营或者进行类似的服务工作。更重要的是,阿尔法方案是一个重要的选拔标准,整个战争期间成为军官的20万人中有三分之二的人受到这种测试的影响。
然而,“陆军测试方案”在军内的影响远没有它在军外的影响大。它使美国更加意识到了心理学的实际用途,特别是从心理测量当中得出来的用途。(詹姆斯·麦基思·卡特尔说,战争把心理学推上了“作战图”;斯坦雷·黑尔说,战争给了心理学一种无法估量的方向,使它朝着实际而不是“纯科学”的方向前进。)
特别是阿尔法方案,它导致了智力测试爆炸性的扩张,使其很快成了一项数百万美元的行业。战争结束数年后,一系列只用铅笔和纸就可以做的阿尔法类型的智力测试推向了全国的学校管理人。最成功的一种是1923年出现的,由特曼、耶基斯和三位合作人员在国立研究委员会的赞助下进行。他们鼓吹这套方案是“军用测试法针对学校需要而进行应用的直接成果”。到本世纪20年代末尾,约7O0万美国学生接受了这些考试。另一项巨大的成功是由耶基斯的同事卡尔·C·布里格姆根据军队模式开发出来的“学业资质测试”。大中小学、军事机构、各种机关协会及不同的工业领域都十分流行采用测试。
智力测试的广泛使用,因为得到统计证据而增加了更强的动力,统计证明,这些测试不仅测量了一系列单独的心理资质,而且是对先天心理能力总体核心或者“总体智力”的测试。查尔斯·斯皮尔曼是一位英国心理学家和统计学家,他向人们显示,许多心理能力都是互为关联的。(比如,一个词汇量广泛的人,通常也可能在算术和其它子项测试中得分很高。)他用这一点指明,天生的总体智力,他称之为g,是所有具体能力的基础。哪怕知识测试有,部分依靠学习,但相关关系暗示着一种天生学习能力的存在。
这就为在学校进行的智力测试提供了另外的依据,因为在30年代,美国和英国都在学校教育过程的早期对学生进行分类工作,让一部分学生学习很多宽泛的课程,以准备好进入高等教育,或者,让一部分学生学习范围较小的“职业性”或者“技术性”的课程,以使他们准备好从事蓝领阶层的工种。在美国,这就叫“分轨”,在英国叫“分班”。
测试的发展不仅限于智力的测验。在20年代和30年代,许多其它的标准也开发出来,以测量音乐、机械、图形、言语和其它方面的能力,还有一系列职业方面的天资。尽管智力测试本身早在20年代就受到攻击了,可是,比奈的心理能力测试法却在心理学研究中打开了一个广阔的新天地,而美国陆军阿尔法方案更是将比奈繁重和昂贵的测试变成了很容易,也很廉价的方法,使其成为心理学方面的流水生产线。
智商争议
智力测验并没有长期保持住其无可置疑的地位。从1921年起,当时,耶基斯根据陆军测试方案的结果编辑了一篇庞杂的报告,智力测试就受到一些人的攻击了,因为,他们说,它测量的不是天生的智力水平,而是后天所学的知识和文化价值,因而对处于主导地位的白人中产阶级有利,而对低层阶级和移民产生了偏见。
这种抨击自有其道理在里面,至少在斯坦福-比奈标准测试中是有这些问题的。这个标准测试中的许多或者大部分项目,测量的是遗传能力和后天所学知识或者技能的组合,可是,一个没有什么机会去获取知识或者技能的人会作出不太令人满意的答案,而不论他或她天生的心理能力是强或是弱。
比如,在12岁水平上,斯坦福-比奈法问到“慈善”和“公正”这两个词的定义问题。如果一位来自西南农村地区棚屋的墨西哥裔美国孩子答题不充分,这说明有天生的智力缺陷,还是说明这个孩子没有能够在白人中产阶级的美国学习到这些概念的意义呢?再者,在8岁水平的斯坦福-比奈标准测试中,有这么一道题:“如果你把属于别人的某件东西弄坏了,你应该怎么做呢?”如果这位8岁的孩子生活在城市的贫民窟里,孩子们需要拼命挣扎才能在这里活下去,那么,他或者她的答案测量的是其天生的智力水平呢,还是贫民窟的传统或者这种子文化中的习俗?
比奈留下了一个悬而未决的问题,即,按照他的标准测试下来的结果,心理发育到什么程度才是因为遗传或者经验所致?可是,特曼在“智力的测量”(斯坦福-比奈标准测试的说明手册)中所说的要旨是,尽管有如上引述的反证情况,智力很大程度上还是遗传所致,而很差的分数表明有心理缺陷,而这种心理缺陷,他说,是一种基因和种族的特征:
(低智力)在西南部的西班牙——印第安和墨西哥家族以及黑人中相当普遍。他们的木讷看上去好像是与种族有关的,或者至少是从他们来自的家族中遗传而来的……笔者预测……将会发现,种族间存在着巨大的智力差别,这些差别决非任何形式的心理培养所能消弥。
一位受人尊敬的专栏作家和十分博学的专家沃尔特·李普曼,他于1922年在《新共和党》杂志上发动了一场批判运动,批评特曼、耶基斯和其他宣称智力测试能够测量天生心理能力的人。李普曼评判了这个课题,从过去一直到目前,说这样的测试给一些孩子,特别是一些贫穷人家的孩子贴上了次人一等的永久标签,从而服务于抱有偏见和有权有势的人。
他和其他持有共同观点的人有非常充足的理由来反对陆军阿尔法测试法,甚至超过反对斯坦福-比奈法。