我们如何知道说话和阅读?这些基本问题导致了麻省理工学院的新研究,该研究使用AI模型来研究我们大脑如何以及为何理解语言。他们发现,人的大脑可能就像智能手机自动更正功能一样工作。
发表在《美国国家科学院院刊》上的这项新研究显示,这些人工智能语言模型的功能与人脑中的语言处理方法相似,表明人脑可能使用下一个词的预测来驱动语言处理。最近一代的人工智能语言模型被设计为预测文本中的下一个词,就像iMessage上的自动更正功能一样,然而这一技术的观察者们却注意到了一些新的东西。这些模型似乎也在学习关于文本含义的东西,显示出理解能力。
模型在预测下一个单词方面做得越好,它就越符合人脑的情况。令人惊讶的是,这些模型如此契合,它非常间接地表明,也许人类的语言系统正在做的是预测接下来会发生什么。这个新的人工智能下一个单词预测模型是深度神经网络的一部分,深度神经网络是人工智能模型的一个类别。在过去十年中,这些模型被用来重现大脑功能,即物体识别。神经网络的功能与人脑相似,因为它是松散地仿照大脑的模式。它们由成千上万的处理节点组成,这些节点紧密相连,相互传递信息。
在这项新的研究中,麻省理工学院的一个研究小组分析了43种不同的语言模型,其中许多是为下一个单词预测而优化的。这些模型包括GPT-3(Generative Pre-trained Transformer 3),它可以在得到提示时生成真实的文本,或者其他旨在提供填空功能的模型。研究人员向每个模型展示了一串单词,以测量其神经结点的活动。然后他们将这些模式与人脑的活动进行了比较。
该研究显示,表现最好的下一个单词预测模型的活动模式与人脑的活动模式最为相似。此外,这些模型的活动也与人类的行为措施相关,例如人们阅读文本的速度。研究人员发现能够很好地预测神经反应的模型也倾向于最好地预测人类行为反应以及阅读的形式。