假如你刚刚遇到一位蓝谷高中的毕业生,她看上去相当傲慢,你是否会认为你遇见的下一位蓝谷的毕业生也会如此傲慢呢?你的好朋友在佛罗里达度过了一个愉快的假期,你是否也会爱上佛罗里达呢?对安东尼进行过面试的公司人事部门经理认为他将会成为一个出色的管理者,那么安东尼会在未来的管理工作中表现出色吗?
要回答上述任何一个问题,你都需要考虑以下概率:某高中的一个毕业生态度傲慢,该校另一个毕业生也会傲慢的概率;你的朋友喜欢一个旅游胜地,而你也会喜欢该地的概率;某人在工作面试中有出色的表现,他以后也会在该项工作中表现出色的概率。
我们是如何进行概率推理的呢?这个问题已经受到许多学者的关注。关注的焦点主要放在确认我们的推理弱点上,即一些导致我们无法理解和运用概率法则的方式以及由此带来的困境。就研究认知偏差及认知错觉本身而言,不仅极富趣味性而且还十分重要,因为它可以帮助我们了解人类是如何进行推理的,正如对视错觉的研究有助于我们了解视觉系统的加工机制。在本章的开始,我将简要地介绍人类概率推理的历史,然后探讨一些最新的研究——人们在统计推理中存在的问题,以及这些问题对社会事件推理产生的影响。随后,会介绍一些重要的非统计性推理方法——启发法,或者说是人们常常喜欢使用的推理法则,而不是那些更为科学的统计原理。本章最后将讨论是什么因素决定了人们有时会选择使用适当的统计原理,而有时又会采用非统计性策略。
概率推理的历史
概率理论是一个比较新的知识成果。人类从古代就开始赌博。古时候,人们将动物的膝节骨打磨抛光做成骰子,掷出后它们会以四种方式落下。虽然这种随机化的工具很流行,但是直到近代,人类才真正理解支配它的原理。哲学家Ian Hacking在他的著作《概率的出现》(The Emergence of Probability,1975)中指出,概率理论在17世纪才出现。Hacking认为,一个人只需懂得些许概率数理知识,他就可以在一个星期内赢得整个古代高卢城。
从历史上来看,人们很晚才对概率有所认识,这一事实很重要,因为它说明虽然人们每天都会碰到一些不确定的事件,并且这些事件本身蕴含着概率原理,但人们却并不能自发地从这些事件中获得概率知识。因此,我们也不必奇怪,即使是现在,人们在进行概率推理时也会遇到困难。也许你会诧异,在这个充满不确定性的世界里,在无法完全理解支配着这些不确定性的概率原理的情况下,人类是如何生活的呢?最恰当的解释就是人类的确形成了对这些原理的基本理解,这足以使我们解决很多推理问题。但是由于理解能力有限,我们还是会犯错,特别是在思考社会事件的时候。只要仔细考虑一下人类推理不确定事件的能力局限性与人们推理物质世界的能力局限性之间的相似性,你就会更好地理解这一点。人类对物质世界中的概率原理了解甚多,所以我们走路时才不会撞墙,开车时才不会撞车。甚至连儿童都能够准确预测投出的棒球的轨迹,从而使自己跑过去接到它。但是,即使是成人,在推理物质世界的事件时,也会犯系统性的错误。例如,第一次世界大战期间,飞行员常常会将炸弹投掷到轰炸目标的前方,因为他们往往是在飞行到目标的正上方时才投掷炸弹,而不是在之前就投弹,提前投弹的做法才是正确的。这说明他们还不是非常了解物质世界,尚没有认识到从飞行的飞机上投掷的炸弹是不可能垂直降落的。现在的许多大学生对日常生活中的物质现象也有类似的错误认识(例如,Kaiser,Proffitt,& McClosky,1986)。所以,我们对日常生活的统计知识有着错误的认识也就不足为奇了。
统计知识逐渐发展,到20世纪中期为止,就已经建立了很完备的概率理论。人们广泛地应用概率理论对不确定事件进行推理,从预测概率游戏中各种结果出现的可能性,到根据死亡曲线计算合理的养老金。尽管缺乏相关的心理学研究,但大家普遍认为人们在日常生活中的判断遵循概率理论。实际上,很多现代经济学理论的预测都是基于这样一种观点,即人们理性地使用概率去计算他们可能的经济得失。
心理学于20世纪50年代开始认真地对概率推理进行研究。诺贝尔奖得主赫伯特·西蒙(Herbert Simon)的研究认为,人们并不总是用完全理性的方式去寻找推理问题的最佳解决方案。他指出,人们在有限理性范围内执行任务,而非采用令人满意的最优化原则,即人们寻找的是一个达到目标的足够好的解决方案,尽管它并不一定是最佳的(Simon,1957)。差不多在同一时期,Paul Meehl比较了临床医生以两种不同的方式得出的推理,即一种是通过整合不同的信息源得出的推理,一种是对同样的信息进行简单的统计合并得出的推理,他发现他们的推理中存在缺陷(Meehl,1954)。Ward Edwards与其同事发现,一条重要的概率规则——贝叶斯定理,可以用来评估人们在面对新的证据时修正自身信念的方式。Edwards等人的研究表明,人们采用很保守的贝叶斯法则,即当人们面对新的证据时,如果有必要,人们的确会修正其信念,但并不是大刀阔斧的修正(如,Phillips & Edwards,1966)。
这些理论的发展为20世纪70年代丹尼尔·卡尼曼(Daniel Kahneman)和阿莫斯·特韦尔斯基(Amos Tversky)的突破性研究奠定了坚实的基础(Kahneman & Tversky,1973)。他们认为,人们对事件进行判断时,常常根据不同类型的推理启发法,即拇指规则——依据直觉和经验的推理方法,而不是不合理地使用统计原理。虽然这些启发法常常能够导致有效的推理,但同时也会导致一些系统性的偏差和错误。卡尼曼和特韦尔斯基的研究工作激发了大量有关推理方面的研究,这些研究主要探讨人们在推理时存在的不足,考察在何种情形下人们容易运用不恰当的非统计性启发法。Richard Nisbett和Lee Ross在他们的一本重要著作中,详细说明了这些研究工作对社会性判断的意义(Nisbett & Ross,1980)。最近,人们对推理不断有新的认识,除了卡尼曼和特韦尔斯基发现的非统计性启发法之外,人们对一些基本的统计原理知识也有一定的了解。这使得许多研究者去试图发现是什么决定了这两种启发法——统计性和非统计性的启发法——在每种情况下的使用(例如,Gigerenzer,1991;Ginossar & Trope,1987;Nisbett et al.,1983)。接下来的部分,我将会介绍卡尼曼和特韦尔斯基提出的几种重要的非统计性启发法,讨论每种启发法如何帮助我们理解我们的社会。最后我还会介绍人们有时会使用的一些较为合理的统计性启发法,以及讨论哪些因素会影响人们选择使用统计性启发法或不太合适的非统计性启发法。
代表性启发法
苏珊可能是一个民主党成员还是共和党成员?杰里最近常常被女性拒绝,这说明他运气不好还是说明他人格异常?我们遇到的很多概率性问题都是这种形式:我们通常被告知要判断一个事例属于一种范畴的可能性,或是判断一个事件有多大可能来自于某一潜在过程。卡尼曼和特韦尔斯基认为,当我们回答这些问题时,通常依赖代表性启发法,即人们通常会根据一个事例在多大程度上能够代表其范畴,或者该事例在多大程度上与该范畴相似来进行分类。如果苏珊的表现与我们对民主党固有的印象相似的话,我们就会认为她是民主党成员。同样的道理,我们对事件的归因也是基于这一事件与促使其产生的过程的代表性程度来进行。我们对人格异常将会产生的后果有某种预期,如果杰里连续遭拒绝这一结果符合这种预期,我们就会认为杰里是人格异常患者(Kahneman & Tversky,1972;Kahneman & Tversky,1974)。
代表性启发法能够帮助我们在很多时候做出恰当的判断,因为事例与范畴的相似性能够很好地说明该事例是这一范畴的成员(参见第2章)。当事例特征能够很好地用来判断该事例是否属于一个范畴时,判断一般都是正确的,我们对诸如动物或水果等事物的归类常常就是如此:某种动物长得像鸭子,走路像鸭子,叫声像鸭子,那么它极有可能就是鸭子。但是,有一些范畴,尤其是社会范畴,特征往往不能作为判断其范畴成员的依据。一个富有的白人,他对犯罪持强硬态度,这些特征符合人们对共和党人固有的印象,但是我们知道,许多民主党人也具有这些特征。在这种情况下,如果我们仅仅以代表性特征作为概率判断的基础,就会产生严重的偏差。因为概率判断同样受到许多其他因素的影响,而这些因素并不会影响人们对相似性的判断。卡尼曼和特韦尔斯基的研究表明,我们常常会忽略这些因素的影响。接下来我们将讨论这些因素。
忽略先验概率(基础比率)
思考下面的问题:
威廉是一个矮个子、害羞的男人。他对诗歌充满热情,喜欢参观艺术博物馆。孩提时代,他常常受到同学的欺负。你认为威廉是一个:(a)农民;(b)古典文学学者?
根据上面的描述,大多数人都会猜测威廉是一个古典文学学者。毕竟,和农民相比较,对威廉的描述更符合古典文学学者的形象。但是在我们下结论之前,还要考虑一个关键信息——基础比率,即该职业在总人口中所占的比率。在美国,农民的数量远远大于古典文学学者的数量。实际上,即使只有很少比例的美国农民符合威廉的特征,这部分农民的数量也会比美国古典文学学者的数量多。因此,当我们猜测威廉从事的职业究竟是哪一种时,应该考虑到这种先验概率。但结果却是,我们常常忽略或无法充分利用这些先验概率或基础比率,而依赖于代表性启发法。
为了说明人类的判断通常基于代表性启发法,而非先验概率,卡尼曼和特韦尔斯基(1973)设计了一个实验。在这一实验中,他们有意识地操纵人们对基础比率的认识,以考察这一操纵对个体判断的影响。他们告知参与者,一组心理学家对100名成功人士(包括工程师和律师两种职业)进行了访谈和测试。基于这些信息,心理学家对他们每个人做了简要的描述。为了操纵基础比率,参与者所获得的信息有所不同。告诉一半参与者,这100位成功人士是由70名工程师和30名律师组成;告诉另一半参与者,这100人由30名工程师和70名律师组成。随后,从关于这100个人物的描述中随机抽取一部分,让所有的参与者阅读。对于每一个人物描述,要求参与者判断该描述有多大可能是对一个工程师的描述。这些描述有代表律师职业特征的,也有代表工程师职业特征的。其中,一段像工程师的描述如下:
杰克今年45岁。他已经结婚并有四个孩子。他通常比较保守,谨慎而雄心勃勃。他对政治和社会事件并没有多大的兴趣,而将大部分的业余时间都用在了自己的爱好上,如家中的木工活、航海以及数字游戏。(p.241)
参与者如何确定此人是不是工程师呢?根据贝叶斯定理,两个因素会影响这一判断:(1)在工程师和律师中,能够找出符合这一人物描述的相对可能性。当然,例子中所描述的特征更接近于对工程师的描述,也就是说,相对于律师来说,这些描述更能代表工程师的特征。相对于只具有中等程度代表性特征的人,那些具有工程师典型特征的人,更容易被判断为工程师。[1](2)工程师和律师在这一组人中的先验概率或基础比率。相对于工程师人数占总数30%的情况,当工程师人数占总数的70%时,人们势必会更多地认为上面所描述的人是一个工程师。
但是,根据参与者的反应,他们只利用了代表性因素而忽略了基础比率,无论告诉工程师占总数的70% 还是30%,其可能性判断的结果在本质上都是一样的。可能性判断是特征相似性程度的一个函数,而不是基础比率的函数。这并非由于人们生来就不能理解和应用基础比率。当没有给出人格特征描述时,参与者能够按照基础比率判断一个未知个体有多大可能为工程师(即70%或30%的可能性)。但是,一旦给出人格特征描述,参与者就不再利用基础比率信息,而是依赖于人物描述的代表性信息。
这些早期研究结果引发了学者们针对“人们是否利用以及何时利用基础比率信息”这一问题的大量研究。研究发现,在某些情况下,人们的确会利用基础比率,但显然没有达到贝叶斯定理所描述的那个重要程度(Kahneman & Tversky,1996)。
当基础比率传达给参与者某些有意义的因果信息时,参与者更有可能使用基础比率进行判断。例如,考试通过率对学生来说就具有显著的意义——如果75%的学生通过考试,则说明该考试简单;如果只有25%的学生通过考试,则说明该考试困难。人们都知道简单的考试比困难的考试更容易通过。换句话说,人们能够利用这一有意义的基础比率对学生作出判断。为了验证该假设,研究者设计了这样一个试验:给参与者看一篇简介,描述的是一个学生的能力及学习习惯。然后让参与者评估该学生能通过考试的概率(Ajzen,1977)。事先会将有关的基础比率信息告诉参与者。对于一半参与者来说,这一基础比率信息是有意义的,他们被告知有75%(或25%)的考生通过了考试。结果发现,这一部分参与者利用基础比率作出判断。在75%通过率的基础比率情况下,参与者更倾向于认为该学生通过考试;在25%通过率的基础比率情况下,参与者更倾向于认为该学生没有通过考试。将同样的基础比率信息也告诉另一半参与者,但将这些信息的意义与考试难度分离开。研究者告诉这些参与者,教授对成功(或失败)的学生非常感兴趣,因此选择了一部分学生,其中75%(或25%)通过考试。结果发现,相对于前一种条件,参与者在这种情况下较少利用基础比率。显然,人们会更多地利用有意义的基础比率,而较少使用看起来像是无关的基础比率。
一些与卡尼曼和特韦尔斯基的工程师/律师问题相似的研究表明,当概率因素被强调或基础比率更明显时,人们倾向于利用基础比率(如,Bar-Hillel & Fischhoff,1981;Gigerenzer,Hell & Blank,1988;Ginossar & Trope,1987;Krosnick,Li & Lehman,1990;Schwarz et al.,1991)。这些研究或明确或非明确地表明,统计推理似乎可以增加人们对基础比率信息的使用。关于这一问题,我们会在后面的统计性启发法中作详细讨论。
上面提到的研究结果,修正了先前关于人们如何利用以及为何没有成功利用基础比率的一些理论,但这并不意味着先前的理论不管用了。虽然我们在一定程度上理解了基础比率的重要性,并且在一定的情况下能够运用它作出判断,但是这种理解并不深入、并不稳定,我们很容易受代表性启发法的诱惑,而忽略或无法充分利用基础比率,从而导致错误。
当我们思考自己或者权威人士作出的一些重要决策时,我们关注更多的是在这之中所犯的错误,而且发现本应在这些决策中发挥作用的基础比率,却常常被忽略了。许多医生都没有意识到,当症状和医疗检查都无法很好地预测一种疾病时,对于一名患者是否患上该病的判断,就会受到当前流行病的影响(Eddy,1982)。敢于冒风险的资本家进行风险投资时,常常没有认识到,对某个新行业进行投资其失败率是相当高的。项目规划者可能没有考虑到与此类似的项目一般需要多长的时间才能完成。新婚夫妇可能没有认识到当前离婚率与他们的婚姻能否长久维持有何关联。有抱负的篮球明星也不能清醒地认识到自己能够进入NBA的概率。所有这些情况中,未能利用基础比率,就可能导致他们极大地低估其行为的风险,从而做出错误的判断和决策。
并不是说,当成功率很低时,就绝不要去冒风险。人们常常进行高风险投资、高难度竞标以及做出种种冒险行为,这样做自有其理由。要说的是,人们常常在并未充分认识到风险的情况下就去冒险,或是事先并不知道风险系数有多大,而选择一些本应该规避的行为。人们没有认识到相关的基础比率,所以常常看不到风险。
人们在判断中常常忽视基础比率,这一点可用来解释许多重要的社会心理学问题,例如接下来我们将讨论的归因、刻板印象以及印象形成等问题。
普遍性作为基础比率 上文探讨了人们从对贝叶斯定理的了解到对概率推理的理解,这些与许多判断任务的完成有关,但是,人们在判断时常常没有运用它们。在社会心理学中,人们对他人行为的归因经历了一个类似的发展过程:最初提出一个标准归因模式,认为人们在进行归因时必须充分考虑各方面因素,其后意识到,我们并不总是按照这种标准模式行事。
想想埃里克在与黛安娜谈话后变得十分沮丧。我们应该把它归因于埃里克(他本身就是个很抑郁的人),还是归因于黛安娜(她让人变得情绪低落)?Harold Kelly(1976)的归因协变模型为我们回答这个问题提供了指导(Kelly,1967)。按照Kelly的模型,我们在归因过程中要考虑三个因素:区别性,即某种结果是否只在特定的原因下才会出现。埃里克仅仅是在与黛安娜谈话后才变得沮丧,还是在与其他任何人谈话后都会变得沮丧?一致性,即同样的结果在同一原因下是否反复出现。埃里克每次与黛安娜谈话后都沮丧不已呢,还是仅此一次?普遍性,即其他人是否在同样情境下也产生同样的行为。是每个与黛安娜谈话的人都变得沮丧不已呢,还是只有埃里克一个人才会如此?
这些因素的不同组合方式会让我们做出不同的归因。如果埃里克和很多人谈话后都会沮丧(低区别性),埃里克与黛安娜谈话后总会沮丧(高一致性),而其他人与黛安娜谈话后都不会沮丧(低普遍性),我们就可以得出这样的结论:在这种情形下,埃里克变得情绪沮丧是他自己的原因。相反,如果埃里克只是在与黛安娜谈话后情绪沮丧,而与其他人谈话后都不会这样(高区别性),埃里克与黛安娜谈话后总是很沮丧(高一致性),并且每个人与黛安娜谈话后都很沮丧(高普遍性),我们就可以认为,埃里克在这种情形下很沮丧是黛安娜的原因;不知为何,她总让人沮丧不已。
最初,研究者假设人们在归因时能恰当地应用这三个维度的信息(Nisbett & Ross,1980)。但是,有研究表明,系统地变化这三方面的信息,发现阅读短文的参与者在归因时对区别性和一致性信息十分敏感,而对普遍性信息不敏感。例如,一个男人为何会保护他的房子?人们对此归因时,往往较少关注普遍性特征信息(是所有其他男人也都会保护其房子呢,还是几乎没有男人会保护他的房子?),更多地关注于区别性信息(这个男人是保护所有的房子呢,还是置其他房子于不顾?McArthur,1972,1976)。后来的一些研究也得到了相同的结论,即人们在归因时较少应用普遍性信息(Major,1980)。
Nisbett和Borgida(1975)认识到,人们在归因中较少应用普遍性信息的倾向与在分类中较少应用基础比率的倾向是一致的。其实,普遍性就是一个基础比率,它反映出人们做出某一特定行为的比率。就像律师在总人口中所占的比率,会影响我们评估杰克是一个律师的概率;被乔丹绊倒的人数比率,会影响我们评估拉尔夫可能被他绊倒的概率(当然,除非我们有充分的理由预测拉尔夫会或不会被乔丹绊倒。但是对于社会行为,我们却很少有这种明确的诊断性信息)。人们作出某种行为的概率是我们对此行为进行归因的一个明确的指标。如果我们预期拉尔夫将会踩乔丹的脚,而且我们知道每个人都会这样,那么我们就不能把这种行为归因为拉尔夫的独特人格或技能。Nisbett和Borgida推测,人们在归因时忽略普遍性信息,是因为我们没能认识到普遍性信息可以用来评估个体某种行为出现的概率。所以就没能进行统计推理,也就没有使用基础比率。
Nisbett和Borgida认为,人们的确没有意识到普遍性信息的作用。而这种普遍性信息可以说明在一个特定的情境下人们做出某种行为的概率,可以影响我们对特殊个体在此情境中的行为的预期(Nisbett & Borgida,1975)。有一项研究,要求参与者阅读一个经典的社会心理学实验,这个实验考察的是学生从内部联络通信系统中得知有同伴癫痫突然发作时,是否能够及时地救助他们。之所以选择这个实验,是因为它得出了一个令人不可思议的结果:大多数参与者都没有及时去援助他们的同伴。在Nisbett和Borgida的研究中,一部分参与者被告知该实验的结果,这种“共同反应”的信息应该引导个体准确地进行情境归因。而另一部分参与者则没有得到这样的信息。接下来让两组参与者阅读一些关于几个学生的简要描述,告诉参与者,这些学生要参与上述的经典实验,并让他们猜测这些学生在该实验中会作出何种行为。有趣的是,研究结果发现,那些被告知实验结果的参与者,在做出判断时并没有使用“共同反应”这一信息。他们的预测与那些没有得到“共同反应”信息的参与者所做的预测没有显著差异。尽管参与者已经知道在经典实验中大多数学生都没有及时救助同伴,但还是倾向于认为他们看到的那些平凡普通的学生会及时援助同伴。也就是说,他们在做出推理时忽略了基础比率,而常常运用代表性启发法。由于所描述的这些普通人的形象更接近于亲切、乐于助人,而非冷酷无情,所以参与者认为他们能够迅速地对同伴施以援助。
人们在预测个体可能出现的行为时不运用基础比率,这似乎是一件不可思议的事情。前文曾论述过,当基础比率信息是有意义的因果信息时,人们才会加以利用。我们利用考试通过率这一基础比率来推断某个学生通过该考试的概率,因为通过率决定着考试的难度(Ajzen,1977)。普遍性信息也非常重要,它说明了情境的重要性。在相同情境下,个体有着同样的行为,表明情境对行为有重要影响。可是,为什么我们不能根据重要的情境条件来推断个体的行为,就像我们能够根据试卷的难易程度来判断学生们是否能通过考试一样呢?社会心理学研究中的一个重要理论揭示了其原因:人们总是低估环境对行为的影响(Ross & Nisbett,1991)。人们倾向于认为行为主要受到潜在人格因素的影响,然而却并没有意识到,即使是微小的环境变化都可能会使行为产生戏剧性的变化(Joans & Davis,1965;Ross,1977;详见第9章)。在不知道情境如何影响行为时,普遍性信息更应该被看做一个重要的基础比率,甚至应高过有意义的、传达因果关系的信息。
虽然人们承认普遍性信息在预测陌生人行为时有重要作用,但大多数人在预测自己或朋友的行为时却不愿采用这一重要的普遍性信息。你可能想说:“我并不在乎别人是怎么做的。我确信自己与别人不同。别人的行为不可能对我(或我父母、朋友)的行为有预测作用。”这样的想法也许有其道理,但正是这些直觉往往让我们犯错。Vallone等人(1990)做了这样一项调查,让学生预测自己及室友在一段较长时间内(大学四分之一的时间或一整年)的行为。该预测包括学校环境中大量重要的行为,如学业(是否会挂科,申请哪个专业)、社会生活(是否会与男/女朋友分手,是否会与室友关系更加亲密)、家庭关系(是否会特别想家,暑假是否回家)以及课外活动(是否为不久后将要举行的选举投票,是否参加大型比赛)。通过比较参与者所预测的行为及他们在这段时间内真实的行为,研究者评价参与者预测的准确性。
该实验设计可以考察如下假设:人们依据有关自我的密切而广泛的信息做出预测的准确性,要胜过从人口基础比率角度所做出预测的准确性。假设其实并不成立。无论是对自我还是对室友,违反基础比率所做出的预测,其准确率都相当低。一项研究表明,当人们用基础比率进行预测时,即当人们认为自己的行为与大多数人一致时,预测的准确率高达78%;反之,不用基础比率进行预测,即认为自己的行为会与大多数人不同时,预测的准确率只有50%。当分析的焦点仅仅集中在高基础比率项目上时,即至少有75%的同学会做出同样行为的项目上,最终得到的结果更加有趣。对于这些项目,根据基础比率进行预测的准确率高达88%,而不根据基础比率的预测其准确率只有28%。我们看到,在基础比率很极端的情况下,就算参与者不根据先前对自己和室友的了解,仅仅只是简单地根据大多数人的行为来预测自己或室友的行为,其预测的准确概率也会相当高。
我们不能指责参与者不使用基础比率,因为他们可能完全没有意识到这些基础比率。这些研究结果清楚地说明,基础比率无疑可以用来预测我们的行为。当你预期自己的行为会与众不同时,你就该认识到自己正冒着犯一个大错误的风险。
刻板印象作为基础比率 人们脑中常常会有这样的刻板印象:男人都比女人自信。Anne Locksley和她的同事认为,这种或者其他的刻板印象都可以看成是基础比率(Locksley et al.,1980;Locksley,Hepburn & Ortiz,1982)。上面提到的刻板印象反映了男人可能比女人更自信,或者说自信的男人在人口中所占的比率高于自信的女人所占的比率。也就是说,刻板印象就是一个基础比率,它定义了先验概率,即任何群体成员的特征都与其所属组群的固有特征相关。因此,刻板印象应该发挥基础比率的作用。回顾之前所讨论的,当人们对某个人一无所知时,会利用基础比率对此人做出判断;但是如果阅读了关于此人的简短描述,就会仅仅只根据描述中的代表性特征对他做出判断,而忽略或无法充分利用基础比率。Locksley和她的同事发现,与基础比率一样,人们也常常使用或忽略刻板印象。
Locksley等人做了一项关于男人比女人更自信这一刻板印象的研究。参与者首先阅读几个男女的一些不同类型的信息,然后让他们判断这些个体的自信程度。有些描述仅仅只给出了个体的名字,在这种情况下参与者往往会利用刻板印象:叫保罗的人一定比叫苏珊的人更自信。另一些信息不仅有姓名,还有能表明其自信的行为描述,例如某个描述如下:
不久前,南希想在课堂上对正在讨论的问题陈述一些她的观点。但是另一个同学却对此夸夸其谈,不让其他人有发言的机会,因此她必须打断这个学生的发言才可以陈述她自己的观点(Locksley et al.,1980,p.827)。
一半参与者读了以上描述,而在另一半参与者阅读的描述中,南希换成了一个男性名字(如汤姆)。尽管一半参与者读到的是男性名字,另一半参与者读到的是女性名字,但是他们都看到了对其行为的描述,因此在做判断时并没有用性别刻板印象:认为做出相同行为的南希和汤姆都很自信。这样看来似乎是,当给出具体行为信息时,我们完全根据代表性启发法做出判断。我们对个体是否自信的判断,仅仅只基于描述中能够表明其自信的行为信息,而没有考虑到个体自信的先验概率,这一概率也就是在缺乏他人行为信息的情况下我们赞同和使用的刻板印象。
虽然在此情形下人们忽略刻板印象会导致推理误差,但Locksley和她的同事们也指出这种错误带来的益处:人们所持的许多刻板印象都是不准确且毫无意义的。我们很高兴看到,当人们掌握了一些行为信息后,就不会采用这些不利的刻板印象去推断别人。相对于熟悉的人,偏见更容易影响人们对陌生人的判断。
Locksley和她的同事们在最初的研究中探索了刻板印象如何影响个体印象的形成。这一研究及其意义会在第8章详述。迄今为止,只有Locksley等人早期的研究证实,人们通常不能将刻板印象这种先验概率与行为信息结合起来。但不容乐观的是,刻板印象仍然可以通过其他途径来歪曲人们的判断。例如,刻板印象可能会歪曲我们对个体行为的理解(Kunda & Thagard,1996)。
稀释效应 对于完全不了解的人,我们常常会用刻板印象对其进行评价,但是只要掌握了个体的一些额外信息,即使我们认为这些信息与当前判断完全无关,刻板印象效应也会被降低甚至消除。如果仅仅只给出个体的姓名,人们就会判断保罗比苏珊更自信(Locksley et al.,1980)。但如果提供一些与自信毫无关系的信息,比如,那个人的母亲“在某个城市的一家银行工作,年薪2.4万美元,每天上下班往返时间为1个小时”,这些无关信息也会削弱刻板印象对判断的影响。人们认为,如果两个人的母亲均在银行工作,保罗并不比苏珊更自信(Hiltonh & Fein,1989)。这个例子说明,无关的或次要信息会削弱那些我们认为的重要信息(本例中的性别)的作用。
Nisbett等人把这种现象命名为稀释效应,即次要信息能削弱重要信息的作用(Nisbett,Tukier,& Lemley,1981)。例如,判断一个社会工作者是否会虐待儿童,提供给参与者一些与此相关的暗示信息,如他有性虐待倾向、酗酒,然后让参与者判断这个男人是否真的有虐待儿童的倾向。结果很明显,大部分参与者都给予了肯定的答案。但是另外一些参与者,除了得到这些相关信息以外,还得到一些与该判断完全无关的信息,如该人经营了一家五金器材店,他的IQ为110。结果发现人们认为他是儿童虐待者的比率降低了。也就是说,在人们的判断中,次要信息的确能够削弱重要信息的作用。
Nisbett和他的同事们认为,稀释效应产生的原因在于人们对代表性启发法的依赖。关于保罗或苏珊的次要信息减弱了他们与性别刻板印象的相似性,究其原因在于,任何不属于性别刻板印象的个体特征,都会减弱个体与刻板印象群体的相似性。同样地,关于社会工作者的次要信息,也降低了他与儿童虐待者两者之间的相似性。我们难以想象,一个有着正常、普通属性的人会是邪恶的,因为我们所认为的邪恶就是纯粹恶毒的形象。
上文论述了人们在做判断时,如猜测某人的职业、解释某人的行为或形成对某人的印象时,常常会忽视或不能充分利用基础比率信息,而是依赖代表性启发法。下文将讨论人们在使用代表性启发法时,总会忽略的一些其他统计信息。
忽视样本大小
思考下面的问题(Tversky & Kahneman,1974,p.1125):
某个镇上有两家医院。较大的那家医院,每天大概有45个婴儿出生;较小的医院,每天大概只有15个婴儿出生。我们都知道,男婴的出生率大约为50%。但是,确切的比率每天都会不同,有时高于50%,有时低于50%。
在一年之中,每家医院都会记录下男婴出生率超过60%的那天,你认为哪家医院拥有这样记录的天数多一些呢?
a.大医院?
b.小医院?
c.一样多?(也就是,两家医院记录天数之间的差别不超过5%)
结果,大多数参与者都认为两家医院男婴出生率超过60%的天数是一样的。这反映出人们对样本大小这一重要因素的忽略。事实上,小样本要比大样本更容易偏离总人口均值。因此,对于总人口中男婴的平均出生率为50%来说,小医院应该比大医院更频繁地偏离该出生率。人们错误地认为两家医院的男婴出生率超过60%的天数是一样,很有可能是基于代表性启发法。他们没有考虑医院的大小,认为60%和50%有同等的相似性。如果只是以相似性或代表性作为判断基础,那么就会认为两家医院偏离人口均值的概率是一样的。
随后的一些研究认为,在某些情境下,人们能够意识到样本大小的重要性,就如同人们有时也会使用基础比率进行推理一样(Nisbett et al.,1983)。但是,人们对样本大小重要性的理解同人们对基础比率的理解一样,都是不稳定的,因此很容易将它遗忘。这为我们的社会判断带来一个重要启示,人们不能仅凭与别人一时的接触就去推测他长期的行为。仅仅用一面之缘得到的印象去推测其潜在人格特征,便会错误地把短暂相处所获得的印象与长期深入了解后获得的信息相提并论。
试想一下,一个你非常信任的同事向你推荐和他一起共事多年的约翰,并且告诉你约翰是个非常能干且富有效率的经理。但你自己在对约翰进行了一小时的面试后发现,约翰并没有出色的管理技能。如果你坚持自己的评价,就如我们大多数人在这种情境中所做的一样,可能你就应该停下来考虑一下,你的印象和你朋友的印象两者所暗含的样本大小。你的印象只基于约翰在这一个小时里的行为,而你朋友的印象则是基于成百上千个小时。约翰在短暂面试中所表现出来的行为以及他给你留下的印象,相比给你朋友多年来留下的印象而言,很有可能是失常的。除非你有理由怀疑你朋友的诚信度或把握人才的能力,否则你就应该认为你朋友对约翰的印象要比你准确得多。
对概率的误解
当我的两个儿子为看什么电视节目而起争执时,总会用掷硬币的方式解决。有时连续掷三次,大儿子都输,他便开始抱怨这枚硬币更喜欢他的弟弟。我们可能会认为7岁孩子的这种逻辑十分可笑。但当我们意识到,自己的大多数行为,都如同掷硬币和玩赌博轮盘一样采用随机策略时,我们就不会再觉得7岁孩子的逻辑可笑了。我们可能并不乐于发现我们常常表现得好像随机化仪器,如硬币和赌博轮盘,认为它们似乎应该具有类似于人的认知能力。例如,人们相信在掷硬币时(H代表正面,T代表反面),顺序是H-T-H-T-T-H要比顺序是H-H-H-T-T-T更容易出现,而事实上两种顺序出现的概率是相等的。我们之所以会出现这种错误的判断,是因为第一种顺序看上去更随机。也就是说,这种顺序更能够代表投币的随机过程(Tversky & Kahneman,1974)。人们错误地认为,即使只掷几次硬币,这一随机过程也会自己表现出来。
在赌场,如果你在一个轮盘旁花费一些时间,就会发现其操作中存在同样的错误。如果你等的时间足够久,就会碰到出现一系列的红牌。当一系列的红牌出现时,下一局就会有更多人把赌注押在黑牌上。为什么在一系列红牌出现后,大多数人会认为下一张一定是黑牌呢?人们错误地认为这时出现黑牌才是合适的。人们都认为,出现一系列红牌后,如果再出现一张黑牌而不是一张红牌,就更能够代表潜在的随机过程。人们在纸牌游戏中所犯的错误就和我7岁儿子的幼稚想法一样。出现三张红牌接着出现黑牌的概率与三张任意顺序的红和黑的牌出现后接着出现黑牌的概率是一样的,都为50%。
对概率的误解会导致人们认为,历经了一系列好运的人接下来就会倒霉。或者认为,因为他的不幸,才会经历一系列倒霉的事情。同样地,如果一栋楼里有几个雇员得了癌症,我们就会认为整栋楼都不安全。我们并不知道,在这样一个充满不确定的世界里,偶然的成功、事故及疾病,都是随机的。体育迷们所迷信的“热手现象”就是对这种误解的最好说明。
“热手”信念 篮球评论员及球迷都普遍相信,球员们偶尔经历了“热手”后,便会成为“得分投手”。这一假设是,球员在几次投篮命中之后会变得自信和放松,因此在接下来的投篮中更容易成功。的确,Thomas Gilovich、Robert Vallone 和Amos Tversky(1985)在询问了100个内行的球迷后发现,91%的球迷认为一个球员在前面两三次投篮命中后,其接下来的命中率要比之前连续失误两三次后再投篮的命中率高,84%球迷认为应该把球传给已经连续投进几个球(2个、3个或4个)的球员。
然而,Gilovich等人猜测,这种“热手”信念来自于对概率的误解。试想某个球员的投篮成功率在50%上下。这个球员偶尔连续投进4个球或更多,就如同抛一枚硬币偶尔连续4次或更多次出现正面一样。重要的问题是:相比于抛硬币,这种连续命中的现象会更多地发生在一个投篮命中率为50%的球员身上吗?更进一步说,相对于没有投进一两个球的情境,在连续投进1个、2个或3个球的情境下,球员接下来是不是更容易投进球呢?“连续命中”的概率是否比随机概率所预期的更高呢?答案当然全部是否定的。
Gilovich等人对费城76人队在整个赛季的投篮记录进行一系列分析后发现,球员的连续命中率与总体投中概率并没有显著差异,球员在连续投中多个球后,再次投篮时命中的概率,并不比其投失多球后再次投篮的命中率高。一个球员是否能投中并不依赖于他之前的表现,就如同抛一枚硬币,它落地后是否为正面并不依赖于之前它出现的是哪一面。当然这并不是说投篮成功率完全依赖概率。一个高水平的运动员当然会比一个低水平运动员更容易投进球。但问题在于,对于这两名运动员来说,下一次投篮成功的可能性并不受他们之前表现的影响(当然命中率会受到他们整体能力的影响)。
这种错误的“热手”信念会让人们付出代价。如果队员们只把球传给“热手”球员(他们完全相信他们应该这样做),而不传给那些能力相当同时又没有被严密防守的球员,就会影响球队的成绩。
一些著名的篮球教练对Gilovich 等人的研究结果作出的反应也充分说明,人们不能很好地理解概率在产生连续事件中所起的作用。波士顿凯尔特人队的Red Auerbach声称:“这小子是谁?他是做了一项研究,但我才不关心。”印第安那步行者队的著名教练Bobby Knight同样满不在乎:“……投篮是否命中存在诸多变数,这一研究没有任何意义。”这些教练不仅没有意识到概率因素的重要性,他们对“热手”信念毫无根据的强烈信仰,也使得他们本能地抵制挑战这一现象的证据。
未能理解回归
你的考试成绩受到你所掌握的有关知识的影响,同时也受到一些偶然因素的影响:可能你很幸运,与测试题目相关的知识你都掌握了;可能因为头痛使得你在考试时没有发挥好。如果分数极高或者极低,我们就能够据此推测你的成绩在多大程度上受到概率的影响,即概率因素是帮了你还是害了你。如果你的成绩非常好,那么除了能力,你可能还碰上了好运气;如果成绩很差,那么你可能碰上了霉运。所以,你真实的能力可能并不如你在考试中所表现得那么好,而且你在类似考试中的表现也不会总是那么好。但不同的是,每当测验分数或多或少受到概率的影响时,人们可能会偶尔考得非常好,但总的来说,在其他时候就不会考得这么好;偶尔会考得非常差,可能在其他时候就不会考得这么差。当考出极好或极差两种极端分数后,可以预期其随后的考试成绩会更加接近平均分数,即所谓的“回归平均数”。这一根基稳固的统计学原理却高度违反我们的直觉。
特韦尔斯基和卡尼曼(1974)描述了以色列的飞行教官认为他们应该避免过度赞扬出色的表现,而应该批评差的表现。这一信念与学习的强化理论完全相反,该学习理论认为表扬比批评更有效。教员们开始时表扬那些着陆很平稳的学员,并批评那些着陆不佳的学员,随后他们发现,那些受到过度赞扬的学员,其成绩会下降;而上次表现差劲的学员却因为严厉的责骂,其成绩变好了。但是教官并没有意识到,他们所看到的只是学员的表现向平均数回归。无论教官表扬还是批评,表现好的学员都可能在下一次行动中表现得较差,反之亦然。
对于人们无法理解“回归平均数”这一现象,卡尼曼和特韦尔斯基(1973)还提供了更多实验证据。例如,即使告诉人们,一个关于集中注意力的测试是受到很多随机因素(如情绪、疲劳程度等)影响的,而且仅仅只能部分地预测总体GPA,但人们还是会认为注意力测试分数极端者的GPA分数也会是极端的,他们的预测是非回归性的。卡尼曼和特韦尔斯基假设,这是因为人们的预测基于代表性启发法,即认为结果(GPA)的极端性应该表现出预测指标(注意力测试分数)的极端性。
不理解统计回归现象还会带来一种令人困扰的结果,当我们注意到某种模式遵循“回归平均数”时,就会试图构造出因果理论来解释这种现象,就像那些飞行教员一样。我们可能会成立一个专门的委员会来确定为何公司会失去那些没有充分发挥其潜力的优秀候选人;也可能建立心理学理论来解释为什么有些孩子不如他们的父母聪明,或大学新生在第二年的表现往往不如第一年(Fong,Krartz,& Nisbett,1986),还可能在一些看似能够提高差生成绩的教学程序上过度投资。但人们却没有意识到,所有这些现象其实只是遵循“回归平均数”的规律而已。
合取谬误
思考下面的问题(Tversky & Kahneman,1983,p.297):
琳达,31岁,单身,坦率直言,性格开朗。她的专业是哲学。当她还是学生的时候,就非常关注歧视和社会公正问题,并且参与过反对核武器的游行。以下两个选项哪个可能性更高:
a.琳达是一个银行出纳员
b.琳达是一个银行出纳员,同时也是一个活跃的女权主义者
绝大多数人都选择了第二个选项。在特韦尔斯基和卡尼曼的实验中,85%的参与者都做出这样的选择。但这一答案却违反了概率的基本原则。概率理论认为一个合取的概率,即两个独立事件同时发生的概率不可能高于单个事件发生的概率。因此,琳达既是个银行出纳员又是个女权主义者的概率不可能高于她仅仅只是个银行出纳员的概率。更简单地来说,所有符合以上描述的女权主义的银行出纳员,必然包含在所有符合这些描述的银行出纳员之内。而人们却没有认识到这一定理,特韦尔斯基和卡尼曼将这种现象称为“合取谬误”。
人们对代表性启发法的使用,可能导致这种合取谬误。琳达与人们心中女权主义银行出纳员的形象更相似,而不只是一个银行出纳员。如果我们仅以这种相似性作为判断的依据,那么就会认为琳达更像一个女权主义的银行出纳员,而不仅仅只是一个银行出纳员。我们陷入这种困境是因为:当对琳达的描述越详细,越符合女权主义者的特征时,琳达的代表性特征增加了,而合取概率却在下降。
合取谬误还会影响到我们如何评估对某个结果的不同解释,即孰优孰劣。在一项研究中,让学生判断约翰为什么会选择达特茅斯大学,这些学生不会认为约翰这么做是因为他喜欢达特茅斯的男女比例。但是当这个不可能的原因与一个可能的原因结合在一起时(约翰选择达特茅斯大学是因为这所大学很有名望,并且他也喜欢该大学的男女比例。),参与者认为,这种结合的原因比单独的原因更有可能成立(Leddo,Abelson,& Gross,1984)。当然,这违反了概率理论。喜欢某校的男女比例作为选择大学的理由是不合理的,但喜欢男女比例和想上名校两者结合的概率更小。然而,两种理由的结合却更能代表我们对择校(理由)的解释,因此我们会判断该理由更有可能成立。
上文简单概述了人们在使用代表性启发法这一策略进行推理时存在的各种问题。当人们使用这种策略而忽略或者无法充分考虑重要的统计信息(如基础比率、样本大小)以及无法理解概率理论的重要原理(如合取原则)时,就会出现严重的推理错误。
统计启发法
试想一下,如果有人说:“我真不明白,我有9个孙子,全部都是男孩”,你会做何反应。你可能会认为这个陈述完全可以理解,不过是一个好奇者在寻求解释。但如果这个人说:“我真不明白,我有3个孙子,全部都是男孩。”你可能会觉得这种说法真是少见多怪,并向这位老人解释,这种结果仅仅只是概率造成的,并没有其他原因。Nisbett等人(1983)认为人们在这样做时,表现出的是有效的统计性直觉。
特韦尔斯基和卡尼曼早期的研究认为,基础统计概念完全“不属于人类的直觉”(1974,p.1125);这一陈述有些夸大其词。后来的研究发现,人们确实了解一些基本的统计原则。Nisbett等人把这种简单有效的统计方法称为统计启发法。不幸的是,人们并非总能在需要的时候使用统计启发法。举例来说,上面提到的“孙子问题”,以及卡尼曼和特韦尔斯基先前描述的“医院问题”,想想这两个问题之间的差别。虽然大多数人都知道,关于性别组成,小样本远不及大样本有代表性,但大多数人还是不能用这一统计原则解决医院问题。在这种情况下,我们没能认识到小医院比大医院会出现更多的偏离样本。因此,尽管我们的直觉中包括一些相当复杂的统计启发法,但在需要利用它们时仍然发现这些直觉还不够完善。
接下来的问题是:什么因素决定着人们在遇到问题时是使用统计启发法,还是使用非统计性启发法?什么因素让我们认识到统计原理与某些概率问题的相关,而不是另一些问题?对这些问题至今都没有完善的答案。但有些影响人们选择不同启发法的重要因素已被确定下来,接下来我们将详述这些因素。
影响人们选择何种启发法的因素
面对一个特定的问题,人们选择使用何种启发法,依赖于人们对该事件本质的认识,以及所具备的统计学常识。人们通常拥有一些相互矛盾的信念,并且拥有可以支配的多种相关启发法,还有那些能够让人们形成某种特定信念或通达某种规则的背景信息,这些都会影响人们对启发法的选择。
我们在某个领域中的核心知识,涉及我们认为到底何种因素(力量)主宰该领域中的事件。例如,试图预测一个学生在标准测试中的表现时,我们可以从学生的学术能力、动机、焦虑、学校的教育质量、家庭教育和一些偶然因素等多方面进行考虑。对影响该事件发生的概率的认识在这里起到了关键作用,因为在某一领域中运用统计思想,最重要的一步就是要认识到概率在该事件产生中所起的作用。人们是否能够认识到事件是受概率影响的,依赖于人们所拥有的相关领域的知识,能够凸显概率因素或其他因素重要性的背景线索,以及人们所掌握的基本统计知识(Nisbett et al.,1983)。接下来将会逐一讨论这些因素。
相关领域的知识
概率因素在许多领域中发挥着重要作用。学术考试的成绩,体育比赛的结果,以及各种社会场合中的人际交往行为,都会受到一些稳定因素的影响,如个体潜在的能力和人格特质;但是,它们也会受到一些偶然因素的影响,如是否正好遇上头痛、是否将要去度假、是否卷进家庭纠纷之中。对这些偶然因素作用的认识,依赖于这一领域本身的性质,还依赖于我们在这一领域所积累的经验。
领域内样本空间的清晰性 在某些领域中,我们可以很容易地将大量事件划分成清晰的单元,并且很容易地对每个单元进行评分。在学术方面,一个测验就是一个自然的单元,而且每个测验的分数都清清楚楚。同样,在运动会中,各项比赛形成各种单元,比赛结果也显而易见。在这些客观领域中,很容易追踪到重复的分数——重复测验的成绩,再次比赛的结果。这种观测是理解概率在事件发生中起作用的第一步,也是理解相关推论统计的第一步。但是,在交互作用的社会中,如何对事件单元化或评分,常常没有那么清晰。例如,构成友谊的单元是什么?即使人们可以人为地划分一些单元,如一次交谈、一小时的相处,但是我们如何对友谊进行评分呢?采用每分钟微笑的次数吗?即使是这种看似客观的评分也会出错,因为不是所有的微笑都象征着友谊。在这些主观领域中,单元化和评分相对困难,概率的作用也不太能够清楚地看到,统计推理也更不太可能。
有研究支持这一观点,证明人们在回答客观问题如体育、能力等问题时更倾向于给出统计性答案;而对主观领域中的问题,如个体喜好和人格评估,则较少作出统计性回答(Jepson,Krantz,& Nisbett,1983)。例如,同样的参与者,在遇到客观领域的事件时(如体育比赛),他们会认为大样本比小样本更可靠;而在面对主观领域的事件时(如个体对课程的评估),他们就不太明白大样本仍然比小样本可靠。另外一项关于人们使用基础比率的实验,也得出了相似的结果。面对卡尼曼和特韦尔斯基最初的工程师/律师问题时,参与者没有使用基础比率;但是当同样的问题以一种卡片游戏的形式再次呈现,每张卡片的一面提供个人的职业,另一面则是他的人格概述,这时参与者却利用了基础比率(Ginossar & Trope,1987)。在卡片游戏中,样本空间是明确的,概率的作用是明显的,因此就更容易做出统计性推理。
相关领域经验 对那些受概率影响的事件,人们对该事件所属领域越熟悉,就越能理解概率的作用,那么在思考问题时也就会更多地应用统计性启发法。即使是在概率的作用相对容易观察的领域,如体育比赛,人们也要在多次观察结果后才能完全理解概率的作用。有经验的运动员比新手更有可能认识到,运动员在不同场合下的表现有好有坏,难以预测。
如果以上直觉正确的话,那么相关领域的经验,就可以促使人们更倾向于使用统计性推理解决该领域内的有关问题。一项研究考察了这种假设,给一部分参与者提出一个关于体育比赛的问题:让参与者解释为什么足球教练所选择的球员在练习赛中表现完美,但到了真正比赛时其发挥却差强人意。这一结果能够用“回归平均数”来解释。大多数有运动经验的参与者,其解释都反映出了这一统计原理:练习中的完美表现并不一定能够代表球员的平均能力,他们可能只是刚好在练习赛中表现得比平时好(Nisbett et al.,1983,p.354)。相反地,那些没有运动经验的参与者则对这一结果采用了非统计性的因果解释,如最初表现很好的运动员故意松懈,以免遭人忌妒;或是他们不想做出很大努力,而只是想依靠他们的天赋度过整个赛季。
给另一部分参与者的几乎是同样的问题,只是稍做修改,使该问题与表演有关:让参与者解释为什么有些演员在试演中的表现好过正式演出。此次的结果也一样,是否有演出经验决定了答案的差异:大多数有演出经验的参与者偏好统计性解释,而没有经验的参与者则偏好非统计性的因果解释。
虽然结果显示,相关领域经验促使人们更多地使用合理的统计性启发法,但同样要知道,对于那些本身就不太容易做出统计性推理的领域,经验的帮助并不大。我们对社会交往非常有经验,但在这些社会情境中,我们对于概率的作用仍然难以理解,可能是因为社会事件难以单元化和评分。
在人们非常熟悉的领域中,这种熟悉性也会受到特定样本大小的限制。例如,有2个、3个和4个孩子的家庭,我们对性别在他们之间的分配很熟悉,因此仅根据概率,我们知道相比于较多孩子的家庭,只有2个孩子的家庭都是男孩或都是女孩的比率要更高。然而,这种对概率作用和样本大小的认识却不能扩展到我们不熟悉的更大的样本中。回想前文所述,大多数人都不能意识到,与每天有45个婴儿出生的大医院相比,每天有15个婴儿出生的小医院其男婴出生率偏离人口性别常态的天数要多(Tversky & Kahneman,1974)。但是,将这一医院问题稍做调整,如小医院每天仅有2个婴儿出生(而不是之前的15个),然后让参与者回答哪家医院拥有100%男婴出生率(而不是先前的60%)的天数多,参与者就能够更好地使用统计原理判断。在一项研究中,给参与者这一修改了的材料或是原始的材料,结果发现,能够运用合理的统计性启发法并且认识到小医院比大医院更容易偏离常态,以及能够这样做出正确回答的人数所占的比例在原始的问题情境下为31%,在修改后的问题情境下则上升到76%(Pelham & Neter,1995)。修改后的问题更加简单明了,因为人们对样本大小为2个孩子时都是男婴的情况,比样本为15个孩子时60%为男婴的情况更熟悉。如果人们对后者的样本比较熟悉,就会认识到在特定大小的样本中,概率对样本的构成起决定性作用。
背景线索
人们选择使用何种启发法还受到问题性质或情境的影响,在能够凸显出概率特征的问题和情境下,人们更容易选择统计性启发法。我们会推测别人认为什么规则更加合理,这种对别人的假设会影响我们的推理;人们更可能使用那些别人认为合理的启发法。
概率因素的显著性 那些能够提醒我们运气或概率作用的信息,更容易使我们使用统计启发法。一项研究发现,参与者能够认识到大样本调查(基于对学校几个月的观察)比小样本观察(基于一天的访问)更具代表性,尽管告诉这些参与者小样本也是随机抽取的。这些信息似乎提醒了人们,小样本更多地受到随机概率的影响(Nisbett et al.,1985)。
对随机选择性的强调也可以提高人们对基础比率的使用。回顾卡尼曼和特韦尔斯基(1973)的律师/工程师问题,给参与者关于某人的描述,让参与者猜测此人的职业,并告诉参与者此人是从一个样本中随机抽取的,样本是由70名律师和30名工程师或30名律师和70名工程师组成,在这种情况下,参与者常常会忽略基础比率的使用。随后的研究试图强调这样一个事实:这些描述是随机选择的(Gigerenzer et al.,1988)。这一次让参与者自己从样本中抽取人物描述,一次抽取一个。实验结果显示,经历了这一强调概率因素过程的参与者,比仅仅告知为随机抽取的参与者更多运用基础比率做出判断(尽管在高显著性条件下的参与者仍然未能充分利用基础比率)。这说明提高概率因素的显著性,就能增强人们对统计性启发法的意识。
对交谈意图的假设 在日常谈话中,人们运用特定的交谈规则,并且利用这些规则去理解别人所说的意思(Grice,1975)。例如,我们假设一个讲话者所传递出来的是相关且有意义的信息,因而照此解读它(Schwarz,1994)。然而,在心理学实验的情境中,常常违背这些规则。在一个关于判断的研究中,实验者不停地向参与者传达一些实验者自己认为是多余的或毫无价值的信息,以此来观察参与者如何看待和处理这些信息。如果参与者错误地假定常规交谈规则适用于实验背景,那么他们就会推测,实验者认为这些信息与他们后面要做的判断是相关的和有用的,参与者就可能会做这样的推理:“如果主试给我一个详细的关于某人的人格描述,那么他一定是想让我在对此人做判断的时候使用这些描述信息。”一些研究显示,采用一些问题来评估人们对基础比率的使用情况,人们解决这些问题时所用的信息和使用的启发法种类,受到他们对实验者交谈意图的假设的影响(Krosnick,Li,& Lehhman,1990;Schwarz,1994)。
Krosnick等人(1990)注意到,那些证明人们不能充分利用基础比率信息的研究,都是先给出基础比率,再给出对个体的描述。如果参与者假设实验者试图让信息与随后的判断相关和有意义,他们就会认为实验者提供的个人描述是建立在基础比率信息上(其信息本身的含义清晰,并对判断有意义),因为他们认为这些描述尤其具有相关性和重要性。而且,正如人们通常所想的一样,参与者假设说话者最后才会说出最重要的信息,他们就会特别关注最后说出的信息。