由乔治敦大学的科学家领导的一个国际研究小组展示了人工智能的力量,可以预测未来哪些病毒可能感染人类--比如SARS-CoV-2,导致COVID-19大流行的病毒--哪些动物是它们的宿主,以及它们可能出现的地方。


Rhinolophus-rouxi-Bat-scaled.jpg


1月10日发表在《柳叶刀-微生物》上的对可能的贮藏库宿主的预测模型组合(题为《优化预测模型以优先发现人畜共患病贮藏库中的病毒》)在一个为期18个月的项目中得到了验证,该项目旨在确定可能携带betacoronaviruses(包括类似SARS病毒的一组)的特定蝙蝠物种。


"如果你想找到这些病毒,你必须从剖析它们的宿主开始--它们的生态,它们的进化,甚至它们翅膀的形状,"该研究的高级作者,微生物学和免疫学系的助理研究教授、乔治敦大学医学中心的全球健康科学和安全中心的成员科林-卡尔森博士解释道。"人工智能让我们可以利用蝙蝠的数据,并将其转化为具体的预测:我们应该在哪里寻找下一个SARS?"


尽管在疾病监测方面进行了全球投资,但仍然难以识别和监测有朝一日可能感染人类的野生动物病毒库。统计模型正被越来越多地用于确定在野外对哪些野生动物物种进行采样的优先次序,但任何一个模型所产生的预测都可能是高度不确定的。科学家们也很少在他们做出预测后跟踪其成功或失败的情况,这使得他们很难在未来学习并做出更好的模型。这些限制加在一起,意味着哪些模型可能最适合这项任务,存在着高度的不确定性。


这项新的研究表明,寻找密切相关的病毒可能并不是一件简单的事情,据预测,全世界有超过400种蝙蝠会寄生betacoronaviruses,这是一个很大的病毒族群,包括那些与SARS-CoV(导致2002-2004年爆发的SARS的病毒)和SARS-CoV-2(导致COVID-19的病毒)等呼吸道疾病有关的病毒。尽管SARS-CoV-2的来源仍不确定,但由于农业扩张和气候变化等因素,其他病毒从常见宿主蝙蝠中溢出到人类群体是一个日益严重的问题。


乔治敦大学生物系的博士后Greg Albery说,COVID-19为加快他们的研究提供了动力。"这是一个非常罕见的机会,"Albery解释说。"在大流行病之外,我们从来没有在这么小的时间范围内对这些病毒了解这么多。相当于以往十年的研究被压缩到大约一年的出版物中,这意味着我们可以真正展示这些工具的作用。"


在2020年第一季度,研究人员团队训练了8个不同的统计模型,预测哪些种类的动物可以承载betacoronaviruses。在一年多的时间里,该团队随后跟踪发现了40个新的betacoronaviruses的蝙蝠宿主,以验证最初的预测并动态地更新他们的模型。研究人员发现,利用蝙蝠生态学和进化数据的模型在预测新宿主方面表现非常好。相比之下,来自网络科学的尖端模型使用了高级数学--但生物数据较少--在随机情况下的表现与预期的大致相同或更差。


俄克拉荷马大学生物学助理教授丹尼尔-贝克尔博士说:"我们的研究给我们提供的最重要的成果之一是一个数据驱动的候选名单,哪些蝙蝠物种应该被进一步研究。在确定了这些可能的宿主之后,下一步就是投资于监测,以了解betacoronaviruses在哪里以及何时可能溢出。"


卡尔森说,该团队现在正与世界各地的其他科学家合作,根据他们的预测测试蝙蝠样本的冠状病毒。


"如果我们花更少的钱、资源和时间来寻找这些病毒,我们就可以把所有这些资源投入到下一步真正拯救生命的事情上。我们可以投资建立针对这些病毒的通用疫苗,或者监测生活在蝙蝠附近的人的溢出情况,这对科学和公共卫生来说是双赢的。"