此次研究的作者团队 受访者供图
参与实验的部分学生成员 受访者供图
2019年6月发表在《科学》上的研究截图
今年7月发表在《美国科学院院报》上的研究截图
2019年6月,世界权威学术期刊之一《科学》杂志发表了一篇题为《全球公民诚信度》的论文,论文中提到,研究人员于2013年-2016年间在全球40个国家355座大型城市开展了一场“丢钱包”的实验。
实验中,10余名外国助理员假扮成捡到钱包的路人,把钱包交到当地公共场所的工作人员手中,请他们处理一下钱包,随后离开。钱包里留下了“失主”的人名和电子邮件,没有留电话。
此后100天,研究人员统计了这些城市的电子邮件回复率,并以此作为公民诚信度的指标,对40个国家进行诚信度排名。结果显示,中国排名最末。
此结论一出,迅速引发广泛争议。不少中国读者在论文下方留言,称“作者没有考虑不同国家人们的电子邮件普及率”“中国人通常使用电话和微信”。
面对这些质疑,论文作者回复称,选择电子邮件作为唯一的联系方式是出于实际考虑, “因为许多国家、电信提供商和社交媒体公司都需要居住或身份证明才能办手机号”。并称文章主要研究“钱包里金额大小对钱包报告率的影响”,比较各国的诚信度不是论文的重点。
但这并不能说服中国的读者。为了驳斥对方的结论,中国14所高校的老师按照原实验流程,在国内进行了一场扩展性的复制实验,重新衡量国人的诚信度。
今年7月,这场实验的研究结果发表在另一国际重要刊物《美国科学院院报》上。研究显示,虽然在中国丢失钱包的“电子邮件回复率”是27.4%,但“钱包回收率”却达到77.8%。
一场没有回报的研究
看到原论文“中国公民诚信度垫底”的结论时,很多中国学者的第一反应是“不相信”。
“很震惊”,浙江大学教授杨芊说。她多年来研究社会文化心理学,觉得中国文化里向来视诚信为美德,且国人已经全面脱贫,不会为了原实验中钱包里放的几十元人民币违背诚信。
上海交通大学公共卫生学院讲师张明吉认为,原研究20%多的诚信度不符合常识。因为在原实验中,外国助理员“丢钱包”的地点是在城市市中心的公共场所, 比如银行、剧院、博物馆、警察局、法院、酒店等。“它是一个公共服务部门,说不定别人看得到,摄像头拍得到。(收到钱包的)工作人员不可能挪作他用”。
而在清华大学经济管理学院教授孙亚程看来,原研究对公民诚实的衡量标准存在问题。“原研究假设唯一道德正确的处理方法就是联系失主。我们不同意。”他认为,保存钱包等“失主”来取也是诚实的表现。
孙亚程和有同样疑问的浙江大学教授周欣悦在3所大学搞了一次小型的实验。他们让学生在校园人流密集的区域投放了400多个钱包,钱包里留有人名和电子邮件,结果发现24%的人联系了“失主”或者上交钱包,而71%的人选择保存钱包,等待“失主”认领。他们将自己的想法和实验结果写成邮件,以稿件的格式投给了《科学》杂志,但编辑部只是将邮件内容发在了评论区。
“要用学术方式去做一个正经的反驳”,孙亚程意识到,想揭示原论文研究上的缺陷,需要用科学严谨的方式搜集更多数据。
就在这时,美国欧道明大学华人教授张琪在一个微信群里发起了复制实验的倡议。张琪说,他不相信中国人的诚信度这么低,但不确定从科学的维度衡量是否如自己所想,“要用实验证明自己的猜想”。
他向老师们强调,此次研究没有资金支持,还有可能发不出来,“要心甘情愿来做这个事情”,但老师们还是纷纷响应他的倡议。
杨芊是第一个响应的。她说,复制实验是社会科学实验中重要的一部分,但近年来,学界一些人认为社会科学实验不可重复,整个学科面临危机,“这是一次重建学科范式的机会”。
紧接着,上海、陕西、广州的老师纷纷响应,老师们一边在线上讨论实验内容,一边在自己的城市招募实验人员。
讨论过程中,张琪鼓励大家争论,“谁有道理听谁的”,这使得每一个实验细节都被充分讨论。一位学生指出,原实验的钱包里放的钥匙太新,容易让人怀疑钱包的真实性,负责采购的老师便专门在网上买了复古钥匙。还有一位老师提到,去法院“丢钱包”不符合实际情况,“法院要被穿过一个很长的庭院,而且戒备森严”,法院便被从实验地点去除。
“尽量复制一个真实世界。”张琪说,除了严格复制原实验的流程,老师们更重要的任务是设计新的实验环节,弥补原论文只靠电子邮件回复率作为诚信标准的缺陷。
为此,他们增加了“钱包回收率”的指标,并补充了回访环节——让实验人员假装成失主的朋友,在实验结束7天后找机构的工作人员要回钱包,如果钱包能找回,则意味着机构的工作人员妥善保管了钱包。
此外,他们还补充了中国“卧底”观察员的角色。张琪说,考虑到现场环境可能影响“电子邮件回复率”,在原实验中,外国观察员交钱包时,还要观察现场的环境,记录“是否有其他人在场” “建筑物内是否存在摄像头”等因素。但这些外国观察员不熟悉中国,不一定能够区分保安、雇员或顾客,无法准确统计在场人数,也可能在与接受者沟通的压力下,没有时间去记录现场环境。
“这相当于实验中的一个黑箱”。于是,有老师建议,让中国观察员记录环境,并让他们观察多少员工参与处理钱包,为之后的诚实行为分析提供更多参考。
但有的老师质疑这一提议,认为每增加一个人,就会增加被识破的风险。
在“谁也说服不了谁”的情况下,老师们最终决定,将每个城市的机构随机分为两组:第一组的观察员不介入实验过程,只是在外国研究助理介入之前“扫描”现场环境。第二组的观察员则介入实验过程,在外国观察员交钱包时暗中记录环境、观察钱包处理的过程。
后来的数据证明,在隐匿好的情况下,观察员的介入并没有影响分析结论。不过,出于严谨,“要把一切可能影响的因素都考虑到”,杨芊说。
一次次总结失败的教训
为了保证实验顺利进行,他们先在杭州进行了预实验。
“预实验就是一次一次总结失败的教训,制定出更加标准的实验流程。”张琪说,很多实验细节都是通过预实验丰富起来的。他记得,最初设计实验时,只设置了1名中国观察员在现场观察记录。但预实验时,学生很难说清楚发生了什么,便增加了用微型摄像头拍摄。
后来,学生反馈,1个人记录、拍摄,忙不过来。观察员又增加到两个人,分别负责记录和拍摄。
预实验之前,踩点组的同学要先去现场确认实验地点,外国助理员和两名中国观察员则需要先在办公室、超市练习实验过程。一位当时负责拍摄的学生说,实验时,她要学习如何自然地拿起奶茶杯,用杯里硬币大小的微型摄像头记录现场。“举的角度、摆放的位置都需要调整,要控制摄像头的方向,不能抖得特别厉害。”
实验前,3名观察员还要提前商议进入现场的顺序、站位、拍摄的最佳角度,“像兵棋推演一样”。张琪说,刚开始实验时,有的小组成员没有沟通就去现场,导致站的位置不对,什么都没拍下来,他们才发现提前商议的重要性。
吴沚桦是回访组的一员。她记得在杭州预实验参加回访时,有两个实验点没有名片里的人名信息,她说不出“失主”的名字,导致回访失败,她在当天的实验总结中强调,踩点时一定要准确记录名片信息。
杭州的预实验结束后,老师们根据实验流程,带领学生在各自的城市再次进行预实验,之后才开始正式实验。
实验的过程很辛苦。一名在北京参与实验的学生记得,实验那几天,她每天在外面待10个小时,顶着烈日走两万多步,回到宿舍后还要上传数据,和老师复盘当天的问题。她听说成都参加实验的同学穿着凉鞋,脚被磨出了水泡。
2019年年底,除了4个实验点因为场所关闭等原因没有完成实验,全国496个点的数据全部收齐。
张薇薇负责此次数据分析工作,也是署名作者里唯一的学生。接到导师的电话时,她还在西南财经大学读博一。张薇薇说,她参加实验的初衷很简单,想看看复制实验的结果,跟老师们“学点东西”。
但她没想到,光是数据分析就花了1年半。
新的实验数据显示,中国丢失钱包的“电子邮件回复率”与原论文的数据相差无几,但“钱包回收率”达77.8%,“中国的公民诚实水平明显高于最初研究中报告的水平。”
2022年6月末,文章第一次投给《科学》杂志。负责投稿的北京师范大学教授刘世勇记得,10天后,他们收到了拒稿信,但他们很开心,信中提到,不论论文之后在哪个杂志发表,《科学》杂志都会报道论文发表的消息。“这是对原来那篇论文结论的高度质疑”,刘世勇说,这使他们对后面的投稿充满希望。
之后,他们先后给《科学》《自然》两大期刊的子刊投稿,都被拒稿。抱着尝试的心态,他们又投给了《美国科学院院报》,这一次,他们等到了回信,信里要求对文章的结论进行理论解释,并给了他们两个月修改时间。
“基于事实的对话胜于基于情绪的对抗”
回忆文章的理论补充过程,张琪坦承并不容易。
他说,老师们讨论过环境变量、机构的种类,发现都无法解释为什么中国的钱包回收率高。直到周欣悦教授提出用文化维度,即个人主义和集体主义的概念来解释中国公民的行为,大家才有了“柳暗花明又一村”的感觉。
老师们认为,个人主义文化倾向于优先考虑实现目标的自我导向行动,比如,向钱包所有者发送电子邮件,这在个人主义文化中是一种典型的代理行为。而集体主义文化则倾向于考虑他人并反映群体归属感的行动,保管钱包就是集体主义文化的典型特征。
对钱包处理情况的观察和回访也为这一分析提供了证据。“卧底”观察员的观测记录显示,31.6%的机构中,参与钱包处理的人数是1人,而回访阶段的访谈报告显示,1人处理钱包的情况只有19.0%,这说明更多人处理钱包时,是集体决策。
经过数据分析,老师们还发现,电子邮件回复率与集体主义指数呈负相关,但“钱包回收率”与区域集体主义指数呈显著正相关,这为评估公民诚实提供了一个新的文化视角。
今年7月,在经历半年的理论补充后,论文终于在《美国科学院院报》发表。“像长跑拿了个冠军”,张琪回忆论文发表时的心情。
紧接着,《科学》杂志报道了论文发表的消息,杂志编辑Ekeoma Uzogara肯定了论文的价值,称《全球公民诚信度》一文“仅仅依赖电子邮件回复率可能会对不同文化背景下的公民诚实度给出有偏差的估计”。
原论文的3名作者也给杂志社发来回信,肯定了中国团队的主要研究结论,同时,他们对论文提出了几点疑问,孙亚程告诉记者,关于这些疑问的回复文章将于近期发表在《美国科学院院报》上。
“基于事实的对话胜于基于情绪的对抗。”孙亚程说,最初看到《科学》的论文时,他感觉到被冒犯,写的回复信也“带点情绪”,但情绪不能赢来尊重和对话。
张琪觉得,这次研究的成功离不开求真务实、循序渐进,“如果不循序渐进,就会错失掉很多重要的细节,造成整个实验的崩塌。”另一个重要的点是自由、平等,“要允许争论,把争论看作一个正常的科学过程”。
张薇薇记得,讨论过程中,老师们经常吵架,最长时吵两个小时,“我当时挺惊讶的”。老师们还会听取她的意见,并将她列为论文的主要作者之一,“我遇到了一个非常公平的团队”。
张明吉说,日常科研中,团队人员大多是师生、同事关系,碍于上下级身份或者利益分配,大家都是“一团和气”,但这次研究因为是自愿合作,反而可以随时争论。“应该多一些科研人员的灵活自主,多一些凭兴趣出发的创新。”
“得有强大的心理素质,才能把它做完。”张琪回忆,新冠肺炎疫情期间,老师们都很累,“压力非常大”。有一段时间,老师们几乎全都病倒了,有的老师经历家里老人生病、去世,还在熬夜分析数据。
“不能中途‘撂挑子’,这也是个诚信问题。”刘世勇说。
杨芊觉得,“得有个交代”。
张琪把这次科研看作一次难得的研究机会,“你一辈子有多少机会能够为全部中国人做研究?”
有老师记得,在成都做实验时,一位同学不慎将摄像器材落到地铁上,一位乘客捡到后,交给了地铁工作人员,摄像器材得以找回。“这是中国人诚信的另一佐证。”