上图:研究人员准备在功能磁共振扫描仪中收集大脑活动数据。
虽然语言解码器的主要目标是帮助那些失去沟通能力的人,但美国科学家承认,这项技术引发了有关“精神隐私”的问题。
为了减轻这种恐惧,他们进行了测试,结果表明,如果不允许解码器在功能磁共振成像(FMRI)扫描仪中长时间训练大脑活动,那么解码器就无法用于任何人。
先前的研究表明,大脑植入物可以使不能说话或打字的人拼写单词,甚至句子。
这些“脑-机接口”主要集中在控制嘴巴构词的大脑部分。
德克萨斯大学奥斯汀分校的神经科学家、这项新研究的合著者亚历山大·胡特(Alexander Huth)表示,他的团队的语言解码器会“在一个非常不同的层面上工作”。
亚历山大·胡特在一次在线新闻发布会上说:“我们的系统确实在思想、语义和意义的层面上起作用。”
根据发表在《自然神经科学》杂志上的一项研究,这是第一个能够在不进行侵入性脑植入的情况下重建连续语言的系统。
“比语言更深刻”
这项新的研究使得研究人员能够绘制出单词、短语和含义是如何在大脑中处理语言的区域引发反应的。
上图:研究人员准备在德克萨斯大学奥斯汀分校的生物医学成像中心收集大脑活动数据。
他们将这些数据输入到使用 GPT-1 的神经网络语言模型中,GPT-1是人工智能技术的前身,后来被部署在广受欢迎的ChatGPT中。
该模型经过训练,可以预测每个人的大脑对感知到的语言的反应,然后缩小选择范围,直到找到最接近的反应。
为了测试模型的准确性,每个参与者都在 FMRI 机器上听了一个新故事。
该研究的第一作者傑瑞·唐(Jerry Tang)表示,解码器可以“恢复用户听到的要点”。例如,当参与者听到“我还没有驾照”这句话时,模型回答说:“她甚至还没有开始学开车”。
研究人员承认,解码器对“我”或“她”等人称代词感到困惑。但他们说,即使参与者自己构思故事,或者观看无声电影,解码器仍然能够抓住“要点”。
亚历山大·胡特认为,这表明“我们正在解码比语言更深层的东西,然后将其转化为语言。”他补充道,因为 FMRI 扫描速度太慢,无法捕捉单个单词,它收集的是“几秒钟内信息的大杂烩”。所以,我们可以看到这个想法是如何演变的,即使确切的单词已经丢失了。
上图:一个人听到的文本与语义解码器的输出的比较。
道德的警告
西班牙格拉纳达大学的生物伦理学教授大卫·罗德里格斯-阿里亚斯·维尔恩(David Rodriguez-Arias Vailhen)没有参与这项研究,但他表示,这项研究已经超越了以前的脑机接口所取得的成就。
他进而表示,这让我们更接近这样一个未来:机器“能够读懂思想,转录思想”。他警告说,这可能会违背人们的意愿,比如在人们睡觉的时候。
当然,研究人员也预料到了这些担忧。
他们进行的测试表明,如果解码器没有经过特定大脑活动的训练,它就不会对人起作用。
事实上,有三名参与者曾轻松地挫败解码器。
在听其中一个播客时,用户被告知要按七计数,说出动物的名字并想象它们,或者在脑海中讲述不同的故事。研究人员表示,所有这些策略都“破坏”了解码器。
接下来,该团队希望加快这一过程,以便他们能够实时解码脑部扫描。同时,他们还呼吁制定法规保护精神隐私。
生物伦理学家罗德里格斯-阿里亚斯·维尔恩(Rodriguez-Arias Vailhen)说:“到目前为止,我们的大脑一直是我们隐私的守护者。但这一发现,可能是未来牺牲这种自由的第一步。”