近日,科学家们开发了一种非侵入式的人工智能系统。在AI的帮助下,无需侵入大脑,就可以将人们的大脑活动转化为文本流,有望最终使得失去身体交流能力的患者获益。
这一最新研究成果5月1日发表在《自然神经科学》(Nature Neuroscience)杂志上,证明了非侵入性语言脑机接口的可行性。这也是AI被用于脑机接口技术的最新例证。
该AI系统被称为语义解码器,一旦人工智能系统经过训练,它就可以使中风、瘫痪或其他退行性疾病患者在聆听或想象讲述一个新的叙事时生成文字。
来自美国得克萨斯大学奥斯汀分校的研究人员通过使用“变压器模型”(Transformer)开发了该系统,Transformer也支持了谷歌的聊天机器人Bard和OpenAI的聊天机器人ChatGPT等AI大模型。
科学家们记录了三名参与者听了16个小时叙述性故事时的核磁共振成像数据,以训练模型在大脑活动和语义特征之间建立映射,捕捉某些短语的含义以及相关的大脑反应。
研究团队介绍称,从非侵入性的磁共振成像(fMRI)记录中解码连续语言的脑机接口将有许多科学和实际应用。 然而,目前非侵入式语言解码器只能从一小组单词或短语中来识别这些大脑的刺激。现在通过非侵入式解码器,可以从fMRI记录的皮质语义表征中重建连续语言,从而可从多个区域分别解码连续语言。
得州大学奥斯汀分校的一份新闻稿指出,经过训练的系统在大约一半的情况下生成的文本与参与者原始单词的预期含义非常接近或精确匹配。目前,该人工智能系统的主要研究人员已经为该技术提交了PCT专利申请。
“对于一种非侵入性方法,与之前通常使用单个单词或短句的方法相比,这是一个真正的飞跃。”这项研究的负责人、神经科学家亚历山大·胡斯 (Alexander Huth)教授写道,“我们正在让模型来解码复杂的想法,并长时间解码连续的语言。”
受试者还被要求在被磁共振监测的情况下观看四个简短的无声视频。人工智能语义解码器能够利用他们的大脑活动准确描述视频中的某些事件。
不过研究人员指出,这一人工智能系统目前不适合在实验室外使用,因为它依赖于fMRI磁共振设备的开机时间需求。不过,未来这项工作也有望转移到其他更便携的大脑成像系统,例如功能性近红外光谱(fNIRS)中。
“fNIRS测量大脑中不同时间点的血流量的不同,事实证明,这与fMRI测量的信号完全相同。”胡斯表示,“因此,我们将来的方法应该转化为fNIRS。”但他承认,fNIRS的分辨率更低。
研究人员同时强调,脑机接口应尊重心理隐私,训练和应用解码器都需要受试者合作,他们从一开始就着手解决有关该技术可能被滥用的问题。这包括如果接受过解码器训练的参与者后来提出抵抗,那么他们思考所生成的想法结果将无法使用。
“我们非常重视脑机接口技术可能被用于不良目的的担忧,并努力避免这种情况。”该论文的第一作者Jerry Tang表示,“我们希望确保人们只在他们想要的时候使用这类技术,并且这对他们有所帮助。”