我们会成为算法的囚徒吗？ - 葱头胖友圈

本文来自微信公众号：nextquestion（ID：gh_2414d982daee），嘉宾：杨天明（中国科学院神经科学研究所、脑科学与智能技术卓越创新中心研究员，博士生导师），采访：Aaron，编辑：EY，头图来自：视觉中国

我们每时每刻都在进行着抉择：早中晚吃什么？出行工具选什么？今天要不要点一杯奶茶？但是你想过没有：我们在面对问题时如何做出准确的选择？我们如何判断自己做出的选择是否符合自身利益？

为了带大家深入了解抉择及其背后的机制，我们将以决策研究领域的问题进行追问，以多人联动的方式，带领大家了解抉择背后的原理以及目前的最新进展。

本次我们采访了中国科学院神经科学研究所杨天明研究员，他将带领我们了解决策机制的价值估算模型，以及我们在面对意外情况时如何进行决策。

Q：您好，可以为我们介绍下您目前主要的研究领域和方向吗？

杨天明：我们目前主要的研究是通过猕猴来研究大脑的高级认知功能，包括认知功能的神经机制和计算原理。比如在决策过程中，大脑如何收集和整合信息、如何计算决策过程中关键的价值信息等。同时我们也会建立一些神经和人工神经网络模型，来解释人和动物的抉择及认知行为以及这些过程中大脑神经元的活动特性。

Q：什么是决策？我们如何衡量不同选择的价值？有统一的抉择模型吗？

杨天明：抉择是一个很宽泛的概念，但是我们每时每刻都在进行抉择——比如你看到这里决定是否继续读下去，早晨选择穿什么衣服出门，我们无时无刻不在进行抉择。目前来说，抉择是由大脑中不同脑区、不同系统、不同环路以不同的方式进行处理的，目前并没用统一的模型来解释各种各样的抉择，需要根据具体的问题来决定。

尽管我们进行抉择的方式多种多样，但是通常情况下，我们做抉择都会遵从趋利避害的原则，即在进行选择的时候我们倾向于做出对自己有利的选择，尽量避免蒙受损失——在这里就涉及一个问题：什么是有利的选择？

一般来说，有利的抉择意味着这个抉择可以为我们带来更多的价值，因此计算出每个抉择的价值就十分重要。比如我们判断某只股票是否有价值、某个职业是否值得选择等等，在我们进行抉择去计算价值的时候，都需要获取足够多的信息，以此判断抉择会为我们带来的价值。

但是相对应的，大多数情况下我们无法获取和掌握所有的信息，所以我们的大脑往往会去寻找一个近似解，也就是价值估算能力。我们平时大多数的抉择都是基于这种价值的估算能力做出的，我们每个人都有着自己的估算能力体系，这可能是人和人之间抉择能力差异的一个关键因素。

价值估算不仅和人的先天资质有关，也和人的后天学习能力有关，比如一个人在一个领域里面进行了长时间的学习和积累，就可以比从未接触过这类信息的人群做出更加准确的抉择。

所以在大多数情况下，尽管我们没有统一的模型进行抉择，但是大脑会通过自己的价值估算体系来判断每个选择带来的价值，并据此做出抉择。

Q：面对突如其来的意外情况，我们如何进行决策？

杨天明：在回答这个问题之前，我首先需要解释一下人类的行为模式。通常情况下，我们的行为可以分为两类，一类叫做习惯性行为，即大脑已经非常熟悉，能够高效进行的行为模式。比如我每天上下班习惯乘地铁，那么我走到地铁站，上下地铁等等一整套行为都可以由大脑按照一种固有模式来进行。习惯性行为也包括我们对某些意外情况的应对，比如看到有东西飞来我们会下意识的闭眼等，这类有一套固有行为去应对的模式就叫做习惯性行为。

另一种行为模式则是目标导向性行为。在目标导向性行为这个模式当中，我们的行为是为了解决一个特定的问题或者一个特定的目标，而这个问题通常是我们不太熟悉的、用习惯性行为无法解决的。比方说我上班坐地铁时，发现地铁有故障，就需要换另一种交通方式，这时候大脑就会在这种不太熟悉的情景下做出判断，并做出选择和规划。

目标导向性行为顾名思义，它是非常有目标性的，是为了达到某一个目标而进行的一系列行为，我们可能会为了这个目标倒推回来寻找解决方案。同时它非常灵活，可以帮助我们去应对之前我们从来没有遇到过的问题，但是这也意味着大脑要做更多的计算，消耗更多的脑力。

日常生活中，我们主要依赖习惯性行为，仅仅在必要的时候才切换到目标导向性行为模式。我们的大脑也有对应的两套系统去处理习惯性行为和目标导向性行为两种不同的行为模式，并在两者之间进行平衡，根据当前的场景来选取适合的行为模式。

在某些精神类疾病中，这两种行为模式的之间平衡和调控可能会出现问题。比如在某些类型的强迫症中，患者可能会非常偏向于习惯性行为，他的固有行为模式非常难改变，甚至他能够理解他现在不应该这样做，但是因为他大脑中非常偏向于习惯性行为模式，从而依然选择按照习惯性行为行动，造成了强迫性行为。

Q：现在研究完成的抉择机制，是否已经可以通过计算机模拟对人的抉择进行判断？

杨天明：神经领域经过多年的研究和发展，对于大脑中处理相对简单的抉择的神经环路已经有了相当的了解，同时也建立了对应的算法和模型，来模拟人和动物的抉择行为。比如比较经典的两难抉择。在两难抉择中，问题被限定在两个选项之中，我们在两者之间做出选择。

神经科学的研究发现，一个经典的模型叫做漂移扩散模型，可以对两难抉择做出很好的解释。它不仅可以帮助我们解释抉择的正确率，还可以帮助我们去解释进行抉择的时候会花费的时间——通常情况下我们花费的时间越多，我们做出抉择的正确率也会有对应的升高。漂移扩散模型可以解释我们在抉择时间和抉择正确率之间是如何选取一个平衡。不仅仅如此，漂移扩散模型还可以帮助我们推断出做出抉择时我们的信心是多少。最重要的是，大脑中与抉择相关的脑区的神经元的活性也与漂移扩散模型非常吻合。

目前来说，我们也在设计一些人工智能系统，希望它可以像人一样做出抉择。在这里，“像人一样”其实可能包含两层含义。一方面，“像人一样”需要计算机除了能做出正确的抉择外，也能模拟人的错误抉择。因为计算机如果要去真正的理解人类，就要理解人类为什么会犯错，只有能够预测人类错误的时候，才可以帮助人们在未来减少错误发生的概率。

另一方面，“像人一样”需要计算机能够有人的高度灵活、高度适应性的抉择能力。计算机虽然有着强大的算力和非常强的存储能力，但是人有非常强的适应能力，我们可以应付各种突发事件，而计算机往往会在一些人类看上去简单的问题上出错。这主要是因为现在计算机还不像人一样拥有强大的学习和推理能力，计算机很大程度上依赖于程序或者神经网络的学习，如果一个事件没有被程序员考虑到或者没有出现在训练场景下，计算机系统在做抉择时就很可能会出现问题。但是人却不一样，人有着极强的适应能力，不管把人放在什么环境中，人都拥有学习来提升自己的能力。所以，“像人一样”就需要计算机有这种学习和提升自己来应对未知问题的能力。如果我们可以把计算机和人的决策能力结合在一起，那么最终就有可能获得一个具有更加强大和高效的抉择能力的系统。

Q：如果我们了解人类的决策机制，是否可以通过决策机制影响人们的最终决策？

杨天明：这是有可能发生的。人类的想象力是无穷的，这就使得人类可以对技术进行各种改造，从而发挥出不同的作用。比如近几年出现的Neuromarketing，即神经市场学，就是通过将人类抉择相关的神经机制的研究成果运用到市场营销方面，从而更好的设计广告和营销来吸引顾客并改变大家的消费抉择。

除此之外，另一个可能就是脑机接口。很多人对脑机接口的第一印象是通过读取大脑的信号来控制一些机器，比方说机械臂等运动系统的技术。但其实脑机接口也可以运用在抉择过程中。比如现在在动物实验当中，我们已经完全可以在动物做抉择的时候去读取大脑的信号，来解码动物的决策过程。我们还可以在动物做抉择的时候，通过微电流刺激等技术来改变动物大脑神经元活性，去影响动物的抉择。把类似的技术运用到人上也是完全可能的。但是在科学技术发展的同时，我们也需要去规范实验的伦理问题，从而使得科学研究迈向对人类有益的方向。

Q：目前很多APP会使用推荐算法为用户推荐相关的内容。推荐算法机制是否会影响人的认知和决策？人是否会成为算法的囚徒？

杨天明：目前APP推荐算法是基于对应的大数据系统——根据很多人的信息去收集人的喜好，并根据对应的数据分析去寻找人群中和你有类似喜好的人，并根据这些人的喜好数据去推荐你可能会喜欢的东西，从而形成一个信息闭环——在你和你喜好类似的人群中，你们看到的东西也是类似的，而长期的看到类似的东西，又会进一步去增强这方面的喜好。

这样发展下去的结果就是会逐渐形成人的信息圈层，信息圈层内的人们和信息圈层之外的人沟通会越来越少——并且圈子之外的人可能喜好完全不一样，而推荐系统并不会给你推荐圈子外面的东西，久而久之，你就只会生活在自己的圈子当中，而对其他的圈子完全没有了解。这就会使得人的社交越来越局限，使得人对世界的认知越来越片面。在这种情况下，局限性的信息分享和传播就可能会对人的抉择产生比较大的影响。

Q：如果我们可以影响人的决策，我们又该如何理解意识和自由意志？这会对未来我们的生活带来怎样的影响？

杨天明：即使是现在的生活，我们在做各种各样的抉择时候已经很大程度上受到现代科技的一些影响，比如做很多事情前我们会经常掏出的手机去查一些资料，通过地图导航，买东西前看点评等，这其实已经是一种运用现代科技来辅助我们做抉择的一种方式，但目前为止，这些技术还没有直接操纵我们的大脑，主要的抉择过程还是在我们大脑当中完成，我们的手机或者电脑只是给我们提供了一些抉择所依赖的信息。

在未来，如果我们对大脑机制了解的更多的话，我们可以直接把这些信息输入到我们大脑当中，这就是现在的一些拓展现实或者叫增强现实的概念。在这种情况下，就像我们看到的一些科幻电影中场景，可以通过AI迅速的给东西添加注解，把相关信息输入到大脑当中，帮助大脑去做判断——通过AI技术帮助人脑掌握更多的信息，这是完全有可能的。

如果再往前进一步，我们可以想象：我们可以将判断的过程直接省略，由AI系统直接做出判断，告诉我们什么是好、什么是坏，从理论上来说，这也是完全有可能实现的——但是这本身就会涉及一系列的伦理问题：你是不是足够信任你的AI系统来帮助你做判断？对于AI的判断，我们是盲从还是有选择的接受？

虽然目前来说，我们的技术还没有达到那个阶段，不过关于伦理的讨论应该尽早开始讨论，以确保未来这些技术可以服务于我们，而不是给我们带来危害。

Q：此前我们采访尧德中教授的时候，尧教授给我们留下了一个问题：我们当前实验中所发现的生物脑中的高效信息加工与处理机制，往往源于从微观至介观和宏观的不同层次，而每个层次都具有一定的意义和科学价值。如何将不同观测层次上的信息处理机制有机整合起来，建立类脑智能体系与框架？

杨天明：我觉得这个问题也许可以用David Marr的计算理论来回答。这个理论由David Marr于80年代提出：对于一个计算系统，我们可以从3个层次去理解。第一个层次是去理解这个系统要解决什么问题；第二个层次是去理解为了解决这个问题系统采用何种的计算方法或算法；第三个层次则是这个系统具体实现这些计算方法是怎样在物理上实现的。

对于人脑来说，我们的大脑存在着一整套实现计算的高效的生物解决方案，它包括我们的神经细胞、突触，还有各种分子基因等等，它是属于David所说的第三层物理实现，这也是很多神经生物学家研究的重点。但是这些研究它一定要结合第二层的研究才有意义。也就是说，我们首先得确定我们大脑系统要实现什么样的算法、做什么样的计算，才能真正理解生物上的实现为什么是这样的。而在算法层面的研究还非常依赖于我们对问题的理解，我们首先要理解人的大脑所做的计算是为了解决什么样的问题，只有确定了这个问题之后，我们才可能对大脑的算法有更加深入的理解。

所以我们在各个层次有各个层次需要考虑的不同的问题，只有当我们把三个层次的研究充分结合在一起，才能最终获得对大脑的完整的理解。

本文来自微信公众号：nextquestion（ID：gh_2414d982daee），作者：杨天明（中国科学院神经科学研究所、脑科学与智能技术卓越创新中心研究员，博士生导师）