本文来自微信公众号:人神共奋(ID:tongyipaocha),作者:人神共奋,题图来自:《憨豆先生的大灾难》
一、你真的缺乏自信吗?
“我从小就缺乏自信,请问老师,怎样才能变得自信起来呢?”
后台常常有人向我咨询这个问题,但我内心其实很好奇:为什么你会觉得自己没有自信呢?至少你在‘缺乏自信’这件事上,还是很有自信的嘛!
要知道,真正的牛人往往都是缺乏自信的。
心理学家贾斯汀•克鲁格曾经为学生安排了一个语法测试,并要求他们写下预估的分数。然后教授按实际成绩把学生分为四等,并和他们预估的成绩作比较:
三角形构成的那条线是学生考后的估分,可以看出,这个实验非常巧妙,因为学生们一般是不做语法测试的,缺少过往的参考成绩,所以最后的预估完全依赖自信程度。
最后的实际成绩(圆点构成的那条线)显示,最差的四分之一的“学渣们”才考了平均十多分,最好的四分之一的“学霸们”平均90多分。
这个实验中提供了一些关于自信度的观察:
1. 能力最差的人对自己的评价离事实最远;
2. 能力中间偏前的人对自己的评价最准;
3. 中间偏后一点的人,对自己的评价最高;
4. 能力最强的人对自己的评价偏低。
所以这篇论文的题目叫《论承认自己无能的困难如何导致自我评价的膨胀》。
很多研究都表明,一个人表现出的自信和他的智商、专业度、用心程度等无关(也有报告认为有非常微弱的关系)(Paese&Sniezek,1991;Ryback,1967;Sniezek&Henry,1989,1990),也与决策质量无关,“信心—正确率”平均相关系数仅为0.28( Sporer,Penrod,Read,& Cutler,1995) 。
问题在于,你的自信,可能会影响别人对你的判断,比如法庭上振振有词的目击证人,对陪审团的影响更大,但研究也表明,目击证人对其证词的信心与证词的实际准确程度没有半毛钱关系。
这才是大家都希望自己更自信的真实原因,自信的人可以争取他人更多的信任和资源,只是不能提高决策质量。
所以说从决策效果的角度,每个人都有自信上的问题,不一定是缺乏自信,也可能是过度自信,更可能是不知道自己此刻到底应该过度自信还是缺乏自信。
这个案例我在之前的文章中引用过,但我没有仔细分析它的意义,直到最近,微信做了一份对自己的生成式人工智能系统GPT-4的评估报告,我才发现,这件事不只是人类对自己的要求,在人工智能训练中至关重要。
专业的说法是“信心校准”。
二、人和人工智能都不知道何时该有信心
ChatGPT是一个生成式的人工智能,它的工作机制是不断预测下一个字的概率,选择概率最大的那一个。但我们知道,很多情况下,出现概率最高的,只是常见的答案,不一定是正确的答案。
ChatGPT的很多回答,内行人一看就知道是错的,但如果是外行——判断依据只能是对方是否内行?回答的语气是不是很肯定?如果ChatGPT用自信的、有说服力的方式陈述,就会骗过你。
如果我们不是用ChatGPT玩一玩,而是处理很重要的工作,那只要判断失误一次,我们就会对它丧失信心,不知道什么时候该信它,什么时候不该信。
所以,系统需要在训练时,不断自我调整参数,以在更多的场景下预测出正确的答案,并且在某些情况下,可以告诉你“它不确定”。
这个过程,就是信心校准,是系统的训练目标之一:知道什么时候应该有信心,什么时候只应该猜测。
人类心理学上也有信心校准,用击中(hit) 与虚报(false alarm) 来对准决策正确与决策错误时对应的信心水平,以让不同信心水平与正确率产生相关性,简单说,在你做出错误决策时,你能否自我评估出自信不足?在你做出正确决策时,你是否更有信心?
这种校准对后续决策具有重要的监控作用,比如,研究发现不同的信心水平可以通过调节后续行为的变化程度(即学习率) ,从而优化行为选择。
经过RLHF训练的GPT-4在这个问题上,比GPT-3.5有很大的改进,比如左边的问题,它放弃了常见但错误的说法(一句英语谚语),而选择了正确但不常见的观点。
但在回答右边的问题时,仍然落入了“高概率陷阱”,它“忽略”了“演员的儿子”这个条件,根据其他条件得到了更常见的答案——猫王,实际上答案是不太出名的另一个Elvis。
这说明GPT-4的自信校准仍然有缺陷。
如果你对人工智能未来改进后可以帮助你工作这件事,有比较高的期待的话,微软的报告不是一个好消息。他们发现,预训练的模型已经达到了高度校准,然而,在后训练过程中,校准度却再度降低了。
简单说,自信校准的提升遇到瓶颈,很可能是多个训练目标之间存在冲突,也可能是一类问题的自信校准提升的同时,又会降低另一类问题的自信校准。
这是不是预示着一种可能,GPT永远无法对自己的预测准确性进行正确的评估,因此也永远无法达到可以完全信任的地步?
本文研究人工智能信心校准的问题,还是为了回到我们应该如何看待自信的问题上,由于机器的神经网络学习是对人类学习的模仿,是否意味着,人类自身也无法正确评估自己的自信程度?
也许,更现实的做法还是回到“我们可能在什么问题上过度自信,什么问题上信心不足”这个问题上来。
前面一章的实验阐述了自信校准与个人能力的关系,下一个实验,分析的是自信校准与任务本身的关系。
三、做有些把握,又不是很确定的事
心理学家利希滕斯坦和菲什霍夫设计了一系列实验(1977),得到了“人什么时候会过度自信”的一些有趣的结论:
结论一:我们在预测概率为50%的随机事件中,“过度自信偏差值”最大——即赌徒心态。
最经典的例子就是股票预测了。无数实验证明(包括经典的飞镖选股实验),股票走势大部分时间是随机的,上涨和下跌的概率是50%。
所以那些没怎么赚到钱的老股民,几乎都是自信校准失败者,这就是股票市场的逆向淘汰机制,凡是投资能力普通且自信校准正常的人,都在亏损后认清现实而退出了,剩下的就都是过度自信的人了。
结论二:当我们面对成功概率为80%的决策时,“自信偏差值”为零。
前面说,股票走势大部分时间是随机的,但仍然有少数时刻,有明显的趋势,上涨或下跌的概率接近80%。
所以,最成功的职业投资者大部分时间都在休息,不是真的休息,而是不停寻找接近80%大概率的机会,此时,投资者的判断非常准确,既不会高估,也不会低估。
结论三:超过80%的极大概率事件,反而会让人信心不足。
所以真正的高手也不会盲目追求稳赢,因为就算有这样的机会,也很可能会导致你过度谨慎,错过时机。
总结一下:
完全没有把握的事,别做;
非常有把握的事,少做;
有一些把握,又不是很确定的事情,自信一点按你的判断去做。
前面分析了自信与能力的关系、自信与任务难度的关系,我忽然发现,这两种自信有细微的区别,分别代表“对自己的信心”和“对于做这件事的信心”,它们之间又有什么样的关系呢?
四、自信与工具自信
沃顿商学院的教授亚当·格兰特(Adam Grant)在他的著作《Think Again: The Power of Knowing What You Don't Know》一书中,提出过一个 “自信模型”。
他认为,人在做一件事时,有两种信心,一种是对自己有没有信心,一种是对这件事、对自己的办法或团队等等(作者统一称之为Tools)有没有信心,后者被称为“工具自信”。
根据这两个信心,他把人做一件事时的状态分布在四个象限内:
右下角的“习惯性自卑”是对自己没信心,但对做这件事的方法、资源、工具等等,有信心。
左下角的“躺平”是对自己没信心,对自己拥有的资源与方法也没有信心,彻底丧失了对未来的希望。
格兰特教授认为这两种都是我们刚进入社会时的初始状态,区别无非是在大公司,还是在小公司。
右上角的“盲目自大”,是相信自己的同时,对自己拥有的资源、方法也有信心,相信自己肯定能做好这件事。
格兰特教授认为这是大部分人必经的中间状态。
而左上角的“自信并谦逊着”是相信自己的同时,不确定目前拥有的资源是否足够,也不确定现在是不是做这件事的最佳时节,甚至不确定自己现在掌握的方法是不是有效。
如何理解呢?假如说,你是一个极有自信的人,但现在我让你学开飞机,你肯定没信心,但这并不能让你怀疑自己的能力。
格兰特教授认为这是人的最佳状态,此时的心态往往是:
第一、自己很有能力,但目前的方法不一定管用,事情也不一定能成;
第二、就算方法不管用,自己仍然是很牛的一个人;就算这件事我没办成,下一次换一个方法也能办成;
第三、就算下一次换一个方法也没能成,再做别的事自己也能成,反正自己最后一定成功。
这就把人的自信,和对资源方法的信心分离开来,前者是一种力量,一种无法证伪、类似信仰的力量;而后者是一件工具,是科学的、充满怀疑精神的、需要进行“信心校准”的工具——人工智能只有后者,没有前者。
所以,过度自信也谈不上是什么坏事,如果只做80%概率的事,人类哪儿来什么进步呢?如果不是我们当年那些过度自信的祖先,我们现在还生活在树上。
本文来自微信公众号:人神共奋(ID:tongyipaocha),作者:人神共奋