来自美加州大学伯克利分校的科学家们最近发表了一项工作,其为思考病原体进化的新方法奠定了基础。“我们的研究强调,对于破坏性真菌病原体Magnaporthe oryzae的分泌蛋白,使用机器学习的无模板建模确实优于基于模板的建模,”发表在MPMI杂志上的论文的第一作者Kyungyong Seong说道。



病原体利用的是一种被称为效应器的毒力因子,这对病原体的生存非常重要。同源建模是最广泛使用的方法之一,但这需要使用已解决的效应器结构模板,而解决所有的效应器结构是一项太艰巨的任务。病原体基因组中编码的效应蛋白太多,其无法简单地依靠实验来解决每一个结构。


Seong和同事Ksenia V. Krasileva则使用了一种新的结构预测方法,该方法能为以前基于模板的方法无法预测的500种分泌蛋白建立模型。


Krasileva表示:“在我们的研究中,1854个分泌蛋白中约有70%被建模,它们的结构根据它们彼此之间的相似性或其他已解决的蛋白结构提供了关于效应物的额外信息。我们证明了新的结构预测方法很适用于破译病原体毒力因子和其他分泌蛋白的问题,这些蛋白之间或与其他蛋白之间的序列相似度往往很小。”


这种新方法使科学家能绘制出数以千计的分泌蛋白并在它们之间建立起缺失的进化联系。“我们相信我们的研究是在机器学习结构预测的新时代,首次在植物病原体上应用结构基因组学的概念,”Seong说道。


“随着结构预测的准确性进一步提高,结合大规模蛋白质结构预测数据的文章将变得更加常见,”Krasileva预测道,“我们的文章可能会引发一些关于如何使用此类数据的想法并导致一些科学家在其他方面提前探索机会。”


他们还发现,在M. oryzae中有许多新的序列不相关的结构相似的效应器,并且结构相似的效应器在其他植物病原体中也有发现。这表明,病原体可能是依靠一套共同起源但在进化过程中序列基本分歧的效应器来感染植物。