测量性格
由于特征即不是可以看见的物体,亦不是某个具体的动作,而是个人的一些特质,研究者们的中心问题是如何测量它们。
首先,他们得弄清楚自己要测量的倒底是什么东西。早期的性格研究者选择了一大批直觉上非常明显的特征,比如内向,自制和自足。可是,不久,他们就放开了眼界,把别的许多东西也纳入进来加以考虑了,这样一来,庞大的数量使这个领域迅速变得一团混乱了。
因为,有太多的可能。勤奋工作的奥尔波特和一位同事曾数过字典中专指不同人类行为或者品质的词,总数达18000之多。并非所有的词都指特征:有些是观察者对另一个人的反应,而非那个人的特征(“令人敬佩”,“讨厌”),有些只指一时的状态,而非长期的特征(“局促不安”,“魂飞胆丧”),有些只是比喻(“活龙活现”,“多产的”)。尽管如此,仍然剩下4000-5O00个词是专指特征的。
有好几百种已经通过各种各样的方式进行过探索,这些方法从主观印象到实验室的试验,从心理分析解释到行为学数据。一些主要的方法如下所示:
个人材料和史料:信件,回忆录,自传,日记等诸如此类的东西里面,都有大量有关受试者性格的信息,当然也有错误信息,因为一个准备让别人来阅读的自我描述,肯定会表现出一个经过装扮的自我而非赤裸的真实。(佩皮斯的日记里面有大量放荡淫逸的段落和无耻的想法,那是准备给他自己看的,而且全都用密码写的。)对一些著名人物有名的诠释都是以个人材料为基础写的,可是,口味和理论一代一代有所不同,同样的材料会形成有关写作者非常不同的形象。以这样一些材料为基础而作的性格分析有时候是非常好的文学作品,而鲜有符合科学的。
面谈:这也许是最常用的性格评估方法,可也是效率最低的一种。一些就业面试官员,大学入学考试的主管和心理分析学家,他们可以在与接受面试者的谈话中得出很多有关一个人的信息,可其他一些人就不一定。研究证明,哪怕是有经验的面试者们,他们对同一个人可能会得到相当不同的评价。另外,面试可以得出一些描述和解释,可并不能得出可计量的特征测量结果。这种面试最适合于辨别一个人有否明显的精神或者情感障碍,但是,在正常人当中,它作为收集一个人的个人资料、态度、回顾和其它一些细节是最为有用的,这些情况会有助于理解以其它一些方法收集到的有关这个人的更为客观的数据。
由观察者定级:研究者经常请某个人的朋友或者熟人来评定他或者她的若干具体特征。为求准确故,研究者会让被提问的人在某种特征的尺度表上定一个级别,这个尺度表从0-5,或者0-10不等——基本上就是托马西乌斯1692年的搞法。可这个方法有许多困难之处。定级的人有他们自己的定级风格(有些人避免极端,另一些人却非常喜欢走极端),受试者在不同的时候对同一个问题有不同的回答,定级还受到“光圈效应”的影响(一位在某种特征上定级定得高的受试者,倾向于在别的特征上也定出高级别)。
那么,总的来说,定级的办法被认为即不是非常可靠,也不是特别有效。(可靠的方法一次又一次地得出相同的结果,有效的方法测量到的正好就是要测量的东西。)可是,在某些情况下,定级办法是即有效又可靠的。著名的特征心理学研究者雷蒙德·卡特尔就依靠这种方法来进行他的工作,他只采用定级者亲眼在很长的一段时间里(可能的话,在一年的时间里),并在许多情境下看到受试者后得出的数据,而且每次只就一种特征定级,以避免光圈效应。这样的前提会改善可靠性和有效性,但又使这种方法极为昂贵,无法承担费用,也极费时间,而且除了在一个人口相当固定而且彼此看得见的院所里以外,其它的地方简直就无法进行。
……
问卷:这是目前最为通用的性格评估工具。如我们所见,这种方法很快扩展到超越了简单的自我评估范围,而成了准客观的技巧,比如提供现实生活情形,并问受试者在这些情境中最有可能的行为方式。其它早期的测试继续提出一些有关受试者的态度和感觉的问题,而不是可能的行为,不过,其措词的办法使受试者难以美化自我形象,如在“个人资料问卷”里一样。大多数问卷有“是/不是”或者“正确/错误”选择作为可能的答案,可有一些也包括了像“不知道”这类的中间答案。
心理学家斯塔克·哈塞维和精神病学家J·C·麦金雷都是明尼苏达大学的教授,他们在30年代设计的、著名的“明尼苏达多级问卷”( M M PI)就属于后一种类型。它里面有550句话,其中包括:
@奇@我大部分时间是很快乐的。
@书@我喜欢社交聚会就是为了跟别人处在一起。
@网@我很显然缺乏自信心。
我认为自己口碑不好。
受试者针对每个问题回答“是,”“不是,”或者“?”(不肯定)。这些问题归类分成十个级别,可以测定忧郁、压抑、歇斯底里、精神错乱、失常、男女异位、偏执、神经衰弱、精神分裂症、轻躁狂和社交内向。这些名字给人一种印象,即是说M M PI主要关心的是精神疾病,它的确也能测量精神疾病,可同样也能检测出正常的性格。比如,那些对“我大部分时间是很快乐的”和这个级别里的大部分其它问题都回答“不是”的人,就被称为是精明、心存戒备和处心积虑的人。那些对“我喜欢社交聚会就是为了跟别人处在一起”和相关问题回答“是”的人,就被定为会社交、活泼和有雄心的人,而那些回答“不是”的人就被认为是谦逊、害羞和自我躲闪的人。
这些解释不是以直觉或者常识为基础,而是建立在经验证据之上的。在设计M M PI的时候,哈塞维和麦金雷把一大批问题拿到精神病院或者有精神毛病的人那里去试,再用同样的问题来问访问他们的正常人,然后把能区分两类人群的问题留下来用作问卷。比如,用作压抑尺度的问题由受压抑和不受压抑的两类人作出不同的回答。
尽管M M PI在过去的半个世纪当中是使用得最为广泛的性格问卷,它也有自己的局限和错误。举一个例子来说,问卷很长。再举一例,许多受试者感到,其中的许多项目如果诚实地去回答的话会过于直露,太令人不安(“很糟的词,经常是可怕的一些词会来到我的脑海里,而且挥之不去,”“我受到同一性别的人的强烈吸引。”)。另外,其它一些项目很明显就是针对病理学方面而来的,让正常的人也显得十分可笑或者觉得受到了侮辱。前一阵子,搞笑专家阿特·巴克沃尔德嘲笑M M PI问卷,他认为应该再加上一些问题,如:
很宽的领带是有病的迹象。
在我年轻的时候,我经常喜欢逗青菜玩。
我的皮鞋光亮剂用得太多。
1949年,一小组性格心理学家得到了洛克菲勒基金的一笔款子,用来在贝克莱的加州大学建立一个新的研究机构,即性格评估及研究所。它原来的宗旨——它的目标后来扩大了些——是要研究出更好的性格评估方法,而在过去的40年里,它已经设计出了数量庞大的研究方法和新的心理学测试办法。可是,最为知名和使用得最为广泛,而且使用至今的一种,就是加利福尼亚心理问卷(CPI),它在这个组织成立的头两年就完成了。
CPI是该所研究员及贝克莱的教授哈里森·高夫博士的工作成果,他决心使用适合正常人的材料来改善M M PI。他收集了1000个问题作为原始材料,有些是从M M PI里面抽出来的,其它一些是他自己和同事们编写的。在助手和同事的帮助下,他测试了这些项目,先在80名研究生中试,再找医学院的80名高年级学生试,在接下来的几年中,总共有13000多不同年龄和不同社会经济地位的男性和女性接受了测试。为了评估这些项目的有效性,或者说评估这些问题所引出的答案的有效性,高夫和他的同事们让一位作为样板的受试人由他的朋友们来定级,然后把定级的结果与受试者自己的答案进行对比,把一些不可信的东西剔除出去。
最后的CPI定稿包括480个项目(1987年版里有462个),比如:
人们常常对我期望过多。
我要坐下来放松一下也很难。
我喜欢聚会,喜欢社交活动。
受试者根据每句话回答“是的,”“不是的”,这些答案会在从自制和自我接受到自我控制和人定这15个性格特征中得出一些分数来(CPI最新的版本里有28个级别。它们可以检测一个人的自制力、保持身份的能力、待人接物的能力、社交表现力、自我接受力、独立性、入定、责任心、社会责任感、自我控制、好印象、社区精神、安宁、耐心、经由服从而取得成就、经由独立而取得成就、智力效率、心理学上的清醒意识、灵活程度、超脱程度、是否喜欢常规、具体化、管理潜力、工作倾向、焦虑程度和三种检测男女异位心理的指标)。从各个方面来说,销售也好,其它语种的翻译情况也好(28种语言,包括克罗迪亚语,印地语和塔加拉族语),还是一些心理学部门和培训项目的领袖人物对它的高度评论也好,都是名列前茅的,它在今天还在使用中的心理学测试方法中处于前10名,也许是前3名的位置,哪怕它问世已经40年了。