大脑如何区分和存储记忆？ - 葱头胖友圈

在神经科学领域诸多关于记忆的研究论文中，有一个高频出现的名字—— Henry Molaison（简称H.M.）。

他曾是一位严重的癫痫患者。1953年，他决心接受一项有望治疗癫痫的外科手术——切除包括海马体¹（图1）在内的脑组织。手术后的H.M.在大多数方面都表现得相当正常：他的个性、抽象思维能力和推理能力并未受到影响；他也保留了童年的记忆，能够清晰地记得小时候老家的地址。然而，让世人感到疑惑的是，H.M.几乎完全丧失了创造长期记忆的能力。他不记得手术后经常看他的医生，甚至也不记得刚刚吃过饭。

¹海马体：组成大脑边缘系统的一部分，位于大脑皮质下方，担当着关于短期记忆、长期记忆，以及空间定位的作用。

H.M.的经历，让人们对海马体与记忆之间的功能联系产生了兴趣。目前，神经科学家和心理学家已经开始认识到，我们的大脑中存在多种类型的记忆：有关过去经历的情节性记忆，有关事实的语义记忆，短时和长时记忆等。但是，为什么这些记忆会以不同类型存在？不同类型的记忆都储存在大脑的什么地方？对科学家来说，这些问题仍是未解之谜。

▷图1 ：H.M.的海马体在手术中被剥除。图片来源：brainfacts

记忆指的是大脑编码、存储和检索过往经验的能力。对过往经验的存储和概括有益于动物做出适应性的决策。举例来说，记住通往特定水源的安全路径，并对这些记忆线索进行概括，就能发现能预测新水源的环境特征，如周围的地貌、植被类型等。因而，这种能够被用来识别和理解当前的情境，并基于过去的经验预测将要发生的事情的记忆的能力，即可预测记忆，对生物的环境适应能力尤为重要。

▷ 原始论文：Organizing memories for generalization in complementary learning systems

如今，一项经人工神经网络实验证实的新理论表明，大脑可能会通过评估记忆在未来的有用程度，对记忆进行分类。具体来说，可预测记忆²（比如每天早餐吃什么或上班的路线怎么走）会保存在大脑的新皮质中，它们将帮助你更好地适应不断变化的环境和做出相应有效的决策。至于一些不太有用的记忆，比如在一个派对上喝过的特殊饮料的味道，则会被直接保存在海马体中，不再会在新皮质中被巩固。

可见，大脑会根据记忆的有用性和可预测性对其进行分类“装箱”，优化了记忆的可靠性，来帮助我们应对新颖的情境。

² 可预测记忆：过去的经验和记忆对未来事件的发生或特征产生一定程度的可预测性。当大脑接收新信息时，先前存储的记忆可以用来识别和理解当前的情境，并基于过去的经验预测将要发生的事情。这种可预测性有助于个体更好地适应环境和做出有效的决策。

一、系统巩固神经网络模型

关于记忆在脑区间的存储，目前较为经典的研究理论是互补学习系统假说（图2）。该理论认为，大脑中存在两个互补的学习系统——海马体和新皮质。海马体，位于脑内深处，人们认为它在学习初期特别活跃。海马体主要负责快速地将新的信息进行编码和存储，并且对于空间导航、事实和事件的短期记忆至关重要。新皮质则是大脑外层的一部分，它会对信息进行更长期的存储和整合。新皮质的学习过程相对较慢，但它能够处理更加复杂和抽象的信息，并将其整合到长期记忆中。这两个系统配合着一起工作，就形成了学习和记忆的动态过程。海马体在学习初期迅速编码新信息，然后逐渐将这些信息传递给新皮质，再由新皮质进行更加稳固和长期的存储。

▷ 图2：海马体与新皮质在储存记忆时的互补学习过程。图源：researchgate

基于上述互补学习系统假说，研究人员建立了一个叫做“教师-笔记本-学生”的系统巩固神经网络模型（图3），该模型由三个功能不同的神经网络组成——教师、笔记本和学生网络。教师网络代表生物生存的环境，它提供经验性的输入；笔记本网络则代表海马体，能够快速地编码环境所提供的每个经验的所有细节；而学生网络则代表新皮质，其通过海马体（笔记本）中记录的经验来预测环境（教师）提供的信息。

具体来说，在神经网络模型中，“教师”是一个线性前馈网络，通过固定的权重和附加输出噪声生成“输入-输出对”。“学生”是一个与之大小相匹配的权重可学习的线性前馈网络。“笔记本”则是一个稀疏的Hopfield网络。在模型训练的过程中，“学生”从包含信号和噪声的有限经验集合中进行权重的学习，最终希望“教师”的输出和“学生”的预测之间的平方差应尽可能小。另外，研究人员也提出假设，在这个模型中，“学生”的主要目标是优化泛化性能，能够最终较好地预测新的“教师”输出。

▷图3：教师-学生-笔记本结构图图源：参考文献1

研究人员使用该神经网络模型模拟了记忆和泛化的动态过程，来研究系统巩固³的实际影响和特征。为了优化学生的记忆回溯，研究人员将模型建模为无限的笔记本回放。在每次模拟中，他们会根据三个不同可预测性（信噪比）的教师网络（高预测性、轻微预测性以及不可预测性），生成经验输入。

结果发现（图4），尽管对于无噪声的教师网络输入，学生网络的泛化误差单调减小，但有噪声的教师网络输入最终仍使得学生网络泛化效果不佳（红色实线）。也就是说，在不可预测的环境中，过度的系统巩固可能会严重降低模型的泛化性能，导致新皮质（学生）过度拟合环境（教师）中不可预测的元素。

这也预示着，在建构神经网络模型的过程中，为了最终能够提高模型的泛化能力，有必要将系统巩固水平考虑在内。

³ 系统巩固：研究人员将系统巩固建模为学生网络内部突触的可塑性。学生网络的可塑性机制受笔记本重新激活的指导，类似于假设海马体回放有助于系统巩固的方式。

▷图4：在优化学生记忆时，学生概括错误、学生记忆错误、笔记本概括错误和笔记本记忆错误的动态变化。图源：参考文献1

二、泛化优化的互补学习系统（Go-CLS模型）

1. Go-CLS模型

Go-CLS模型是在系统巩固神经网络模型的基础上建构而成的。考虑到上述实验中在不可预测的环境里系统巩固对模型泛化能力的不利影响，研究人员调整了模型的系统巩固水平。该理论的基本假设是，系统巩固的程度是自适应调节的，当系统巩固到一定程度后，如果继续巩固反而会削弱模型的泛化能力，就应该停止巩固。从目前Go-CLS模型的训练结果看，在这种设定下，学生（红色实线）可以从每位教师的经验中实现几乎最佳的泛化性能。

▷图5：在优化概括的表现时，学生概括错误、学生记忆错误、笔记本概括错误和笔记本记忆错误的动态变化。（b）高可预测性（无噪声）；（d）轻微可预测性（轻微噪声）；（f）不可预测性（多噪声）。图源：参考文献1

2. 与系统巩固的神经网络模型比较

研究人员将上述两个模型进行比较，发现两者在处理不同预测性教师数据时表现出明显差异。在标准系统巩固模型中，所有记忆都会被巩固，但泛化能力随着教师可预测性的不同而有很大变化。对于可预测性较低的教师，这种模型的泛化误差较高（图6，左）。与之相较，Go-CLS模型消除了过拟合的有害效应，在学生能够到达最优记忆性能之前结束。并且随着教师的可预测性程度增加，泛化性能和记忆性能均得到改善（图6，右）。

▷图 6: 巩固模型与Go-CLS模型下学生泛化性能随教师的可预测性程度变化的比较。左：系统巩固的神经网络模型，右：Go-CLS模型。图源：参考文献1

可见，Go-CLS模型不仅在逆行性遗忘⁴（即过去记忆的丢失）方面与系统巩固的神经网络模型表现不同，还在时间依赖性泛化方面表现出显著差异。在模拟海马体剥除后，在逆行性遗忘方面，系统巩固的神经网络模型，总会表现出记忆逐渐丢失的趋势，即过去的记忆更容易被遗忘。而Go-CLS模型则能够解释不同类型的记忆丢失现象，包括那些随时间变化而不同的记忆丢失模式。在时间依赖的泛化层面，在处理不同的可预测性的经验时，两种模型都会产生多样的泛化曲线，最大泛化性能随着教师的可预测性增加而提高。然而，在学生过拟合时，只有Go-CLS能够维持其随时间变化的泛化能力。系统巩固的神经网络模型甚至可能导致学生过度泛化，产生极不准确的输出。

⁴逆行性遗忘（retrograde amnesia）：在某个特定时间点之前发生的事件或信息无法被记忆，而在这个时间点之后的记忆则相对保留。这种记忆缺失通常是由脑部受损或其他神经系统障碍引起的，影响了个体对过去经历和信息的回忆。逆行性遗忘可能涉及特定类型的记忆，如语义记忆或事件记忆，而不是影响所有记忆类型。研究者通常根据记忆缺陷在最近和远期记忆中是否相似（平坦逆行性遗忘）、在最近记忆中是否更为明显（分级逆行性遗忘），或者在最近和远期记忆中是否都不存在（无逆行性遗忘）来对海马体遗忘动态进行分类。

三、对互补学习系统理论的补充

Go-CLS神经网络模型的实验结果为互补学习系统假说提供了新的见解。海马体和新皮质耦合的快速和慢速学习模块——是互补学习假设的基本前提。

于是，研究人员又利用Go-CLS神经网络模型比较了耦合的学生-笔记本网络（图7，左）与孤立的学生（图7，中）和笔记本网络（图7，右）的泛化性能。考虑到Go-CLS神经网络模型中，“学生”表征的是互补学习系统假说中的新皮质，“笔记本”表征的是海马体，因此孤立的学生和笔记本网络的实验组，则分别表示各自仅用新皮质或仅用海马体学习的情境。

▷ 图 7: 学习系统模型示意图，（a）使用学生-笔记本网络；（b）仅使用学生网络；（c）仅使用笔记本网络。图源：参考文献1

孤立学生网络模型必须在线从每个教师网络的经验中学习，并且无法重新访问/回顾以往的信息。这就限制了它的泛化性能（图8，橙色与黑色曲线相比）。结果表明，使用两个包含学生的网络模型都要比仅含笔记本的网络模型泛化性能更好。另外，当教师网络提供适量可预测的数据时，学生-笔记本耦合网络模型的泛化增益要远远大于孤立的学生网络模型。因此，在数据适中且环境中噪声适度的情况下，学生-笔记本耦合网络模型在泛化性能上更为优越。

另外，当学生的经验数量等于学习模型中可调整的参数数量时，使用“回顾先前的学习经验来进行学习”（回放功能）可以最有效地提升学生的学习能力。但这种情况下也存在风险：大脑可能会过度适应这些旧信息，导致对新情况的反应不够灵活，就像机器学习中的“双峰下降”现象一样。

在这种现象中，当数据量处于与网络大小相关的中等水平时，过拟合最为严重。当记忆模式的数量接近网络模型可以处理的最大数量（容量）时，神经网络必须最精细地调整其权重。这通常需要对权重进行大幅度的更改，以减小小的训练误差。为了避免这个问题，最优学生-笔记本网络模型可以通过根据教师的可预测性调整系统巩固的数量，以防止过度适应噪声。这预示着，大脑可能也在以类似的方式根据经验的可预测性来调节学习和记忆的方式。

▷图8：互补学习系统的优势。图源：参考文献1。

四、总结

Go-GLS模型为我们提供了一个有趣的理论假设，即大脑可能是通过评估记忆的可预测性和对未来的有用性来对记忆进行分类的。

▷图9：用一则故事说明系统巩固模型与 Go-CLS 模型在概念上的差异图源：参考文献1。

设想这样的情境：一个小女孩与父亲在湖边度过快乐的一天。在这一天的经历中，可能包含了新鲜采摘的草莓，味道很甜这样的可预测关系。Go-GLS模型的研究结果表明：可预测关系应该从经验中提取出来，并与相关经验的记忆相互整合，通过系统巩固过程来生成记忆，并被强化，实现可预测经验的泛化。在这一天的经历中，也可能会出现不可预测的共现事件，比如父亲的衬衫颜色刚好与草莓的颜色都是红色。但这类关系不应在新皮质中被巩固。当然，它们仍然可以作为这一天的情景记忆的一部分存放在海马体中。

另一方面，Go-GLS模型与人工智能研究有许多微妙的联系。Go-CLS模型通过教师-学生对的最优逼近误差来定义可预测性。但是，这与实际情况中，是否可以学到最优学生权重是不同的。比如梯度下降可能陷入局部最小值或短暂地降低泛化性能。另外，由于过拟合同样可以在更复杂的学生架构以及现代深度学习模型中观察到，Go-GLS模型中提出的基本概念也适用于更广泛的模型类别。同样，一些机器学习方法可以插值训练数据并很好地泛化，因此我们有必要寻找能够在学习过程中更好地平衡记忆和泛化的学生网络架构和学习规则。

然而，Go-GLS模型仅关注了简单的监督学习问题，未来我们仍需要解决在具有更为多样化的泛化情境下的最优巩固问题，例如强化学习和大型语言模型中的新兴少样本学习。

参考文献：

[1] Sun， W.， Advani， M.， Spruston， N. et al. Organizing memories for generalization in complementary learning systems. Nat Neurosci 26， 1438–1448 (2023).

[2] https://www.quantamagazine.org/the-usefulness-of-a-memory-guides-where-the-brain-saves-it-20230830/

本文来自微信公众号：追问nextquestion （ID：gh_2414d982daee），作者：轻盈，编辑：野雾、韵珂