如果在群体讨论中最重要的人首先发言,这反而会让判断的噪声更大。本文来自微信公众号:巴伦周刊(ID:barronschina),采访:何刚(《巴伦周刊》编辑),对话嘉宾:丹尼尔·卡尼曼、奥利维耶·西博尼(书籍《噪声》的两位作者),头图来自:视觉中国
在颠覆我们对人类决策机制的理解,刷新我们对金钱观念的认知方面,也许没有人能够超过以色列裔美国心理学家丹尼尔·卡尼曼,他的上一本行为经济学著作《思考,快与慢》,让许多人对人类决策过程中的非理性因素醍醐灌顶,并且颠覆了对人类理性的迷信。
在接近十年思考之后,他的新著《噪声》即将出版,这又是一本能够颠覆对人类决策过程认知的著作。近日,《巴伦周刊》中文版主编何刚通过Zoom采访了《噪声》的两位作者丹尼尔·卡尼曼和奥利维耶·西博尼,跟他们探讨了为什么噪声如此重要,它跟偏差有什么不同,以及为什么群体决议反而可能会增加决策中的噪声,如何才能降低决策中的噪声。
何刚:我是来自《财经》杂志和《巴伦周刊》中文版的何刚。几个月前,我们的美国同事采访了您,讨论了《噪声》这本书,现在,它的中文版即将在中国出版,我很高兴继续与您讨论这本书。这是一本非常重要的书,在您出版了著名畅销书《思考,快与慢》之后,为什么会开始关注噪声?噪声对我们决策来说有多重要?
丹尼尔·卡尼曼:是的,我认为我们绝对应该从定义我们所说的“偏差”和“噪声”来开始这次对话。
最简单的方法是从测量的角度来思考,因为我们认为判断也是一种测量,使用的仪器就是人类的大脑。当你在测量某样东西时,例如,用一把很好的直尺来测量一条直线的长度,你会发现两种误差,其中一种误差是偏差(bias),也就是误差的平均值。
如果你在测量一条直线时,没有任何偏差,也就是说平均而言,你的测量是完全正确的,但即使在完全没有偏差的情况下也仍然存在一种误差,因为你所做的每一个测量都与其他的测量略有不同,有一半时间你在正确的长度之上,有一半时间你在正确的长度之下,这种变异性就是噪声(noise)。
偏差是误差的平均值。在我的整个职业生涯中,我一直致力于研究心理偏差,也就是导致人们测量结果过高或者过低的系统性判断误差。有各种各样的原因会导致人们犯下可以预测的系统性误差,比如过度自信、乐观主义、悲观主义和锚定效应等等,这些就是我研究了50年的东西。
几年前我注意到,事实上,几乎没有人关注另一种类型的误差,也就是判断的变异性,而事实证明,判断的变异性也很大。当不同的法官看待同一个被告,或者不同的承保人看待同样的风险时,他们得出的判断也大不相同,这就是噪声,噪声无处不在。
每个人都知道当被告被宣判时,不同的法官会有不同的判决,但是促使我们写这本书的原因并不是法官的判决会有所不同,因为这是人尽皆知的事情,而是法官在判断上的分歧比人们预期的要多得多。在一些研究中,实际结果大约是人们预期的五倍,这是一个很大的数字,也是我们写这本书的原因。
何刚:谢谢卡尼曼教授,我想问问西博尼教授,对于像我这种没有统计学背景的读者来说,我们如何理解偏见和噪声的区别?为什么噪声如此重要?
奥利维耶·西博尼:首先,噪声并非更加重要,它只是和偏差一样重要。正如丹尼尔所说,我们之所以关注这个问题,是因为偏差已经得到了很多关注,而噪声却没有得到任何关注。所以我们试图重新解读这种不平衡。我们并不是说噪声比偏差更重要,我们想说的是,它跟偏差同样重要,但却没有受到太多关注。
接下来,如果你对统计学一无所知,这里有一个例子可以让丹尼尔所描述的情况生动起来。假设早上你踩着浴室磅秤称体重,根据你的经验,你知道,一般来说你的浴室磅秤对你来说有点太大方了,它告诉你的重量比你实际的重量轻了一磅。所以你已经习惯了你的磅秤减少一磅,你知道平均来说,加上一磅才是真实重量。这就是偏差,这是你的浴室秤的平均误差。
如果你在同一个早晨快速连续两次或三次踩上你的体重秤,你会发现读数并不完全一模一样。这种无法解释的变化不是平均误差,平均误差是你所知道减少的那一磅,这就是噪声,它会出现在每一次测量中。
发生在你浴室磅秤上的事情也会发生在我们的判断中,平均误差是偏差,在这种情况下如果还存在着随机误差或瞬态误差,那就是噪声。
何刚:人们可能会说,这是由于人类的局限性,科技和人工智能能够帮助减少我们的偏差和噪声的影响吗?
丹尼尔·卡尼曼:帮助减少噪声的基本原理是纪律,而纪律可以通过不同的方式来产生。
纪律意味着你在做判断或决定时要遵守规则。当你决定是否录取一个学生进入大学时,你要考虑学生的平均成绩,这就是接受了一个纪律规则,它比人们只是跟随他们的主观判断或者印象要减少一些噪声。
在许多领域,更复杂的规则来自人工智能或算法,规则为判断问题和作出决策提供了答案,规则的一个最大优点就是它们没有噪声。如果我向同一个算法提出两次同样的问题,我会得到相同的答案。如果我在不同的场合问同一个人同样的问题,他们可能会给出不同的答案,人类是会受到噪声影响的,而规则不受噪声干扰。
在某些情况下通过用算法代替判断,在另一些情况下通过对判断加强纪律性,用更有组织、更加系统的方式作出判断,我们就可以减少噪声。
何刚:这本书提出了一些试图减少或消除噪声的方法,但在艺术中运用这样的方法是非常困难的,比如像《尤利西斯》这样的小说,您是否同意至少在某些领域,噪声也是有益的?
奥利维耶·西博尼:如果我们以艺术为例,我们不会建议减少艺术中的噪声,因为它不是噪声。我们将噪声定义为人类判断中那些不必要的变化,这里的关键词是“不必要”。我们希望艺术判断具有多样性,我们想要审美判断的变异性,我们希望你们的品位、政治观点以及各种各样的变化都是好的,都是可取的。
我们不希望变异性存在的时候是当你踏上你的浴室磅秤时,你有一个真实的体重,你希望你的浴室磅秤尽可能接近真实的重量。同样,如果你在做预测或者判断时,你希望尽可能接近结果的真实价值。比如如果你正在决定一个候选人是否适合一份工作,你希望尽可能接近这个候选人是否适合你正在招聘职位的正确判断。
我们定义噪声的前提是不需要,在这种情况下,噪声一律是不好的,因为我们想要一致性,我们想尽可能接近我们认为正确的答案。而在生命中的其他事物中,减少变异性是可怕的,实际上,我们并不把这种变异性称之为噪声。
何刚:卡尼曼教授,你在这本书中提到一种非常有趣的现象,也就是所谓的“群体极化”现象,这意味着一个群体在彼此交流之后会变得更加极端,我们如何解决这样的问题?是否应该减少交流以避免更多的噪声?
丹尼尔·卡尼曼:噪声和偏差之间有一个非常重要的区别:当你用尺测量一条线,或者用秤测量你的体重时,你在对多次测量结果进行平均之后,测量结果比单次测量结果的噪声要小。
举个例子,如果我在测量仪器上取了四次平均值,然后我在测量仪器上又取了四次平均值,这两个平均值之间的差值,将会小于任何两个测量值之间的平均差值,正如我们所解释的。
在这里有个非常重要的前提是,测量或者判断是相互独立的。在许多组织中,不同的人来为组织做出判断或决策,比如有许多承保人在评估公司的风险,每一个人都代表着组织。在这种情况下,你绝对不希望有噪声,因为组织希望用一个声音来说话。显然,汇总判断是减少噪声的好方法。
在现在的实践中,我们汇总判断的大多数场合都是在开会讨论的时候,但是召开会议的方式有好有坏,好的方法能够减少噪声,坏的方法则不会减少噪声。主持能够减少噪声会议的更好方法是让每个人提前做出判断,将这些判断汇总起来,然后再开始讨论,让人们重新做出判断,这样得出的平均值将比最初的噪声要小。
会议的通常运作方式是:第一个发言的人会有很大的影响力,说话最大声的人会有很大的影响力,说话最自信的人会有很大的影响力。这意味着你无法获得团队所有成员的意见,因为有些团队成员不会用他们自己的声音说话,他们会受到别人的影响。
你提到的群体极化现象是另一个让事情变得更糟的问题。当群体拥有一个特定立场,如果人们最终能够达成一致,他们往往会倾向于同意一个更加极端的版本。
例如,在西方,我们有陪审团在某些情况下设定损害赔偿或判决。我们发现,如果所有陪审团成员预期评估损害赔偿额大约为平均10000美元,当他们进行讨论时,他们将会评估15000美元的损害赔偿。这个群体的答案往往比最初的平均值更极端,这就是极化现象,它增加了噪声。它通常不会比个体更能够减少噪声,而是会增加噪声,甚至比经过讨论后人们的平均意见增加更多,比你按照正确方式开会情况下要多得多。
何刚:非常有趣。您提到了会议的例子,我们都知道“头脑风暴”这种会议形式,这是否意味着这种做法的无效?西博尼教授,您对这个问题有什么看法?
奥利维耶·西博尼:头脑风暴的问题实际上不是判断力的问题,因为它是一种试图创造多样性的意见和分歧的努力。这个问题与我们正在讨论的噪声问题稍有不同,但我想它们有一些共同点,事实上,也有一些关于让头脑风暴有效方法的研究,主要提出了以下几点建议:
首先,要让人们独立地形成自己的观点,尽可能独立产生自己的想法,因为人们独立思考的时候会比一起思考的时候更有效率,尽管这是违反直觉的,但实际上已经得到了充分的证明;
其次,让参会者聚集在一起,讨论建立在彼此独立思考之上的想法,这是头脑风暴的常见部分;
再者,拥有一个良好的过程来选择你想要的想法,在你真正产生许多想法之前,不要这样做。
丹尼尔·卡尼曼:我想补充一点。组织中排名最低的人应该首先发言的观点,适用于那些旨在做出判断的会议。这是一个普遍性的规律,它会让群体判断更加接近于独立判断,因为最不重要的人发言不太可能影响下一个人的判断。
如果从最重要的人开始发言,你就得不到太多具有多样性的意见,这实际上会让判断的噪声更大。当群体的判断缺乏多样性时,不同的群体可能根据首先发言者的意见而得出不同的结论,这是一种群体制造噪声的方式。
何刚:让我们深入追问一下辩论与噪声的关系。例如,在美国的总统大选中,辩论非常受欢迎,但在中国,辩论却非常有限。那么,辩论到底是能增加噪声还是减少噪声呢?
奥利维耶·西博尼:这取决于你如何进行辩论。如果辩论是由组织中权威人士发起的,而且人们互相影响,你就会增加噪声,因为群体会在权威人士最初表达的观点上变得更加极端和两极化。
这就是你在社交网络上看到的事情,当人们呆在一个关系紧密、思维方式与他们相似的群体中时,他们的观点就会变得更加极端,他们变得更加两极化,因为他们在团体内部相互加强。
而在一场运作良好的辩论中,你所看到的是人们带着不同的观点来到辩论现场,交换意见,希望能得出一些更为微妙的观点。在社交媒体上,这种辩论要少得多,而在真实的、相互尊重的人之间的对话中,这种辩论更为频繁。
这就是在陪审团中应该发生什么的理想状态。我们从本书描述的实验中可以知道,在一场运行良好的辩论中,我们可以利用这场辩论来减少噪声,而不是放大噪声,虽然这种事并不总是会发生。
何刚:你们都提到了独立判断的重要性,这也许是减少噪声的关键方式。在互联网时代,互联网上有太多的声音和噪声,人们应该如何保持独立思考?
丹尼尔·卡尼曼:首先,我想区分社交媒体上存在的各种对话和我们所说的噪声。我们真正谈及噪声的时候是当不同的人代表组织说话时,我们希望他们用一个声音说话,他们能够彼此同意。当多个人参与决策或者做出判断时,你希望他们彼此独立。我们并不是说独立是人们的一般特征。我们讨论的是对同一个问题的独立判断。
例如,当你在测量噪声的时候,我们称之为“噪声审查”,你会针对各种各样的评判提出同样的问题,然后告诉他们:不要相互交谈,直到你对问题有了自己的答案。这也是我们希望的开会方式,判断必须是独立的。我们并不是说人们应该彼此依赖或独立,我们所说的依赖性和独立性是在针对特定问题进行判断之上。
何刚:西博尼教授,这本书中提到有三种类型的噪声,水平噪声,模式噪声和情境噪声,在我们的现实生活中,如何区分这三种不同类型的噪声?
奥利维耶·西博尼:用举例来说明最简单。我们在书中使用的例子是法院里的法官。假设有两个法官,A法官和 B法官,A法官通常比B法官更严厉,B法官是那种当你被分配给他时,你的律师会说,“哦,我们很幸运我们碰上了B法官”的法官,而A法官是那种你的律师会说,“哦,我的上帝。真倒霉”的法官。平均来说,A法官更严厉,他作出判决的平均严重程度高于B法官,这就是我们所说的水平噪声。
第二种噪声是情境噪声。我们之前也简要提到过,A法官和B法官都不是恒定不变的,他们跟自己也不一致,他们对环境很敏感。比如,A法官下午会比上午更严厉,或者B法官心情不好时会更严厉,因为他最喜欢的足球队输了比赛。这就是我们所说的情境噪声。每个法官在不同的时候都不完全相同。事实上,他们对那些本不重要的情境特点很敏感。
还有第三种噪声模式噪声,这是最大、最不容易直观理解的,但却最重要的一种噪声。当A法官和B法官审视同一个案件时,他们实际上看到的不是同一件事情。他们透过自己的视角来看每一个案件,他们对每个案例都有自己的看法。
即使A法官平均比B法官更严厉,但也许在某个特定案件中,他会比B法官判决更轻一些,因为他在这个案件中看到的不同于B法官在这个案件中所看到的。每个人都有自己的历史、偏见和偏好,而这些偏好和偏好之间的差异将会在他们的判断模式上产生差异,这就是我们所说的模式噪声。
基本上来说,水平噪声是人们平均的不同,情境噪声是指人们在不同的情境下自己跟自己的不同,而模式噪声是指人们在偏好,或者他们对于什么重要什么不重要排名上的不同。这三者加在一起产生了很多变异性,我们统一称之为噪声或系统噪声。
何刚:西博尼教授,如果我们把这三种噪声应用到投资市场中,那么它们对于投资者来说分别意味着什么?
奥利维耶·西博尼:以这三种噪声为例。例如,如果你总是认为某项投资是好的,或者你总是非常厌恶某类风险,认为某项投资永远是坏的,这就是“水平噪声”,随着时间的推移,你会学会调整自己。
情境噪声则是这样一个事实: 有时候你心情好,一切看起来都像是一个好机会,有时候你心情不好,一切看起来都像是一个愚蠢的想法。限制这种影响的一个好方法就是放慢脚步,在两三个不同的时间点来观察同一个投资机会。如果你仍然认为你在上周看到的投资机会是一个好的投资,那么它就更有机会成为一笔好的投资,反之亦然。
第三种是最难控制的噪声,这就是模式噪声,因为你的判断力——让你接受或者对一项投资敏感的特殊吸引力——正是带来问题的东西。我们的建议是,不妨试着思考一下,除了你之外,其他人对你所看到投资目标的平均判断会是怎样。
先把个人投资者放在一边,假设你是一家专业投资公司的专业投资者。你会期望所有这些专业投资者遵循相同的方法,使用相同的工具,相同的指标,相同的原则,相同的数据,对每个案例都会得出相当接近的判断。
根据我们所做的调查,我们知道事实并非如此。但作为投资者,我们可以尝试减少这种变异性。其中一种方法是问问自己:“我知道我对这家公司的看法,那么我的同事会怎么看这家公司?”
何刚:按照这种方式,我们是否应该只关注指数投资和ETF基金,而不是选择一家特定的公司?
奥利维耶·西博尼:我没有资格提供投资建议,但是如果你问我如何投资我的钱,那正是我所做的,我投资于ETF基金,但我不是在给出投资建议。
何刚:卡尼曼教授的意见是什么,个人投资者如何避免市场的噪声?
丹尼尔·卡尼曼:毫无疑问,当个人做出个人决定时,他们制造的大部分噪声来自于他们认为自己拥有、但事实上却并不拥有的信息。行为经济学家之所以推荐指数基金或ETF基金,有很多原因,但并不是你在上下文中看到的主要原因。
如果人们在判断中引入纪律,就会减少噪声,改善结果。我们不提供投资建议,但如果你问任何行为经济学家,通常的建议都是遵守规则,不要试图做太多具体决定,因为你不会做得很好。
何刚:我们知道降低噪声意味着成本,如何评估降低噪声的成本?
丹尼尔·卡尼曼:我们倾向于通过我们所说的“噪声审查”来评估噪声的大小。噪声审查就是你向多个专业人士做出同样类型的判断,例如,评估投资或者评估风险,或者对不同案件做出判断。为了测量偏差,你通常需要知道正确的答案,而只是为了测量噪声,你不需要正确答案,这是一个非常有用的特性。
噪声审查仅仅能够测量判断的变异性,测量噪声的成本则是一个单独的问题,对此我们没有太多的经验,但是如果真的测量的话,你可能会发现代价高昂。
奥利维耶·西博尼:噪声的代价几乎肯定比你想象的要大,因为噪声比你想象的要多得多。噪声的代价往往被低估,在一个组织中,噪声总是被低估的原因是,组织在隐藏问题方面做得很好,因为这有点令人尴尬,所以他们对问题视而不见。当你发现你所信任的人做出的判断实际上是完全不同的,这有点恼人,当你意识到这一点时,你会显得有点傻。
为了避免这种尴尬,组织会进化出各种各样的防御手段,让他们避免痛苦地意识到自己正在被噪声困扰。例如,他们会按照我们所描述的那种方式开会,也就是说,最高层的人首先发言,然后每个人都倾向于同意最高层的意见,因此我们从来没有真正暴露我们之间的分歧。
因为我们用这种方式来隐藏噪声,我们几乎总是低估它的广泛性,而且我们几乎总是低估它的代价。当你问它的成本有多高时,我们显然无法给你一个数字,但我们可以告诉你,通过运行一个噪声审查,你可能会发现它代价高昂。
何刚:最后一个问题来自《巴伦周刊》的中国读者,他认为许多现代社会的问题来自极端主义,在未来信息仍然是支离破碎的,它会让更多人走向极端,这会让未来更加令人悲观吗?
丹尼尔·卡尼曼:这是一个非常普遍的问题。很明显,任何增加情绪在判断和决策中的作用的事情都可能降低理性在判断和决策中的作用,并导致糟糕的决策。我们能够看到,在某些领域情绪的作用在不断放大,这可能不是一件好事。
何刚:非常感谢两位教授。
本文来自微信公众号:巴伦周刊(ID:barronschina),采访:何刚,对话嘉宾:丹尼尔·卡尼曼、奥利维耶·西博尼