据外媒报道,大多数新出现的人类传染病(如COVID-19)是人畜共患病--由源自其他动物物种的病毒引起。早期识别高危病毒可以改善研究和监测的优先次序。英国格拉斯哥大学的Nardus Mollentze、Simon Babayan和Daniel Streicker于9月28日在《PLOS Biology》上发表的一项研究表明,利用病毒基因组的机器学习(一种人工智能)可以预测任何动物感染性病毒感染人类的可能性。
在人畜共患疾病出现之前识别它是一个重大挑战,因为在估计的167万种动物病毒中,只有一小部分能够感染人类。为了利用病毒基因组序列开发机器学习模型,研究人员首先汇编了一个来自36个科的861种病毒的数据集。然后他们建立了机器学习模型,根据病毒基因组的模式分配人类感染的概率。然后,作者应用表现最好的模型来分析从一系列物种中取样的其他病毒基因组的人畜共患潜力预测模式。
研究人员发现,病毒基因组可能具有独立于病毒分类关系的通用特征,并可能使病毒预先适应于感染人类。他们能够开发出能够利用病毒基因组识别候选人畜共患病的机器学习模型。这些模型有局限性,因为计算机模型只是识别有可能感染人类的人畜共患病毒的一个初步步骤。在进行重大的额外研究投资之前,由模型标记的病毒将需要确认性的实验室测试。此外,虽然这些模型预测病毒是否能够感染人类,但感染能力只是更广泛的人畜共患病风险的一部分,它还受到病毒在人类中的毒性、在人类之间传播的能力以及人类接触时的生态条件的影响。
据研究作者说:“我们的研究结果表明,病毒的人畜共患潜力可以在很大程度上从它们的基因组序列中推断出来,这令人惊讶。通过突出具有成为人畜共患的最大潜力的病毒,基于基因组的排名可以更有效地针对进一步的生态和病毒学特征。”
“这些发现为我们利用人工智能技术从病毒的基因序列中提取已经令人惊讶的信息量增加了一个关键部分,”Babayan补充说。“基因组序列通常是我们拥有的关于新发现的病毒的第一个,而且往往是唯一的信息,我们能从中提取的信息越多,我们就可能越早确定病毒的起源和它可能带来的人畜共患风险。随着越来越多的病毒被描述出来,我们的机器学习模型在识别那些应该被密切监测和优先开发预防性疫苗的罕见病毒方面将变得更加有效。”