本文来自:界面新闻,原标题《颜宁回应研究方向正被AI取代:AI基于其科研数据进行预测》,作者:李科文,题图来自:视觉中国


11月11日,颜宁在微博回应近期回国创办深圳医学院科学院,及其核心科研方向正被AI代替等相关话题。她表示,AI是基于其此前的研究解析数据基础上对人体蛋白质结构进行预测,期待AI越来越强大,帮助生物科研工作者可以正儿八经地从化学角度研究生命起源。


颜宁还表示,充足的启动经费是科研人员在科学自由探索的基础,“第一惨是想做实验没经费;第二惨则是大把启动经费才用一半就挥挥手要走了。”


图源:新浪微博
图源:新浪微博


此外,颜宁还是回应称:


但是这两天有发自内心爱护我的师友总喊我辟谣,我真的很忙啊(忙到现在才瞜一眼微博,容易么我)。八竿子打不着、错漏百出、但凡花一个钟头读论文也不至于那么眼瞎的碰瓷文章,给眼神都浪费时间,为啥要我辟谣啊?有朋友想写澄清文章也被我拦了,好意心领了,但真犯不着(当然,如果将来某天SMART的法务看不下去了有什么行动,我就不拦了,反正现在小伙伴们已经默默地该截屏截屏,该存档存档。谢谢目前在厦门那位,从你那受的启发。[坏笑]祝好运[打call])


【无缝切换到科普博主】去年8月8日,给了一个报告,讨论了AlphaFold的局限性;到今年的11月11日,发现去年的报告还是可以一张都不用改。简而言之,我专注的电压门控钠离子和钙离子通道的几个关键问题(electromechanical coupling, ion selection, MOA of drugs and toxins),AlphaFold在我们过去解析的诸多结构的基础上,去年的预测达到了我们2017年的水平;今年依旧停留在我们2017年的水平(这里仅针对Nav/Cav)。在与专门做结构预测的AI团队合作,他们做预测我们做实验,测试新型小分子与蛋白的相互作用,迄今为止预测无一正确。


结构生物学不仅仅是看到Fold(折叠),更要理解蛋白质的动态变化,要理解与其他生物大分子或者调节小分子的相互作用,要理解在细胞原位里的状态,这些都是AI目前尚无能为力的领域,因为尚没有足够的数据库去训练它。举个例子,我们Cav2.2的结构去年发表晚了,尚未放在数据库里被AlphaFold用来训练,所以它预测的模型就与实验结构严重不符。


真正的研究者都乐于拥抱技术进步,善用各种技术去探寻、解答自己感兴趣的问题。事实上,我期待AI越来越强大,如果它真的可以强大到把我上述提的三个理解都实现网页链接,那我们真可以正儿八经从化学角度研究生命起源了。


【恢复傲娇毒舌本色】之前跟一个密友逗贫:做PI(principal investigator)第一惨是想做实验没经费;第二惨则是大把启动经费才用一半就挥挥手要走了,不带走一叨乐。准备做PI的孩子们,记住在求职的时候,启动经费越多越好,因为那是你做科研最自由的fund。啥叫endowed chair (讲席教授)啊?这不只是个荣誉头衔,背后那是真金白银捐赠来的让你自由探索的经费,有这种不用写proposal的unrestricted fund,多想不开才非要申请NIH的啊(当然,还是要申请一两个嘛,否则我替闲人说:你看,申请不到吧)


此前在2022深圳全球创新人才论坛上,颜宁宣布,即将辞去普林斯顿大学教职,归国加盟深圳医学科学院。早在2017年,因选择离开任教10年的清华大学到普林斯顿大学就职,颜宁曾遭受不少争议。如今颜宁毫无征兆宣布选择归国,再次引发网络热议,包括其主要研究方向是否已被人工智能代替等。


结构生物学是生物物理学的一个重要分支。该学科主要应用物理学的思想与研究方式,采用X射线晶体衍射、核磁共振、冷冻电镜成像等技术,精确解析蛋白质、核酸等生物大分子的三维结构及生物大分子之间的相互作用机制。研究这类问题的群体被称为结构生物科研工作者。颜宁便是其中的一员。她的主要研究领域为重要膜蛋白的结构与功能机理。


简而言之,许多像颜宁一样的结构生物学科研工作者,他们的日常工作便是帮助人类看清楚这些上述提及的构成生命活动基础的大分子以及它们那更加微小和复杂的空间结构。诺贝尔奖获得者费曼曾经半开玩笑地说:“许多基础的生物问题是非常容易解决的——只要能看到它们就行。”


近年来,随着英国的人工智能公司DeepMind发布的AlphaFold2,以原子水平的准确度预测了2/3的蛋白质结构,让非机构生物学专业的公众以为AI技术已能代替结构生物学科研工作者的工作。在知乎上,甚至还有人将AlphaFold2比喻为珍妮纺织机,而把结构科研工作者进行的结构生物学实验比喻为手工作坊。


颜宁表示,其专注于电压门控钠离子和钙离子通道几个关键问题(electromechanical coupling, ion selection, MOA of drugs and toxins)。AlphaFold在其团队过去解析的诸多结构的基础上,去年的预测达到了其团队2017年的水平;今年依旧停留在其团队2017年的水平(这里仅针对Nav/Cav)。在与专门做结构预测的AI团队合作,他们做预测其团队做实验,测试新型小分子与蛋白的相互作用,迄今为止预测无一正确。


想理解颜宁回应文案的意思,便得首先得理解其所说的其专注的科研项目——电压门控离子通道是什么?电压门控离子通道是一大类位于细胞膜上、通过感受电信号控制离子跨膜进出细胞的蛋白质。


上世纪四五十年代,英国科学家霍奇金和赫胥黎发现了动作电位。之后,他们发现电压门控钠离子通道引发动作电位,而电压门控钾离子通道(Kv通道)则能使细胞去极化,恢复至静息电位。


电压门控离子通道目前是仅次于G蛋白偶联受体(GPCR)的第二大药物靶点。外科手术用到的麻醉剂通过抑制钠离子通道(Nav通道)起作用;钙离子通道(Cav通道)则是降压药物的靶点。因此,对于电压门控离子通道的研究,尤其是结构生物学研究具有重要的生理学和药理学意义。


而钙离子(Ca2+)是生物体内重要的第二信使,在肌肉收缩、神经信号传递、腺体分泌、基因转录调控以及细胞凋亡等众多生命过程中扮演重要角色。一般情况下,细胞内的钙离子浓度远低于细胞外或者内质网中的钙库。


五十年代,科学家发现在没有钠离子的情况下,依赖钙离子也能产生动作电位,这是由电压门控钙离子通道介导的生理过程。电压门控钙离子通道响应细胞膜电位变化而激活,运输钙离子进入细胞,进而引发一系列下游信号通路。


其中,Cav1.1(也叫dihydropyridine receptor,DHPR)是最早被鉴定出的电压门控钙离子通道,主要位于骨骼肌细胞的横小管(transverse tubule),是肌肉兴奋收缩偶联(excitation-contraction(E-C)coupling)过程中的关键蛋白。骨骼肌细胞在兴奋信号作用下会导致膜电位的变化,Cav1.1在感受膜电位变化后与肌质网膜上的RyR1蛋白发生相互作用,导致RyR1将肌质网中的钙离子快速大量释放到肌细胞质中,进而引起骨骼肌收缩。


据清华大学新闻网此前消息,2015年12月22日,颜宁在担任清华大学教授期间,其研究组在《自然》(Nature)杂志发表题为《电压门控钙离子通道复合物Cav1.1的三维结构》(Structure of the voltage-gated calcium channel Cav1.1 complex)的研究论文,首次报道了真核生物电压门控钙离子通道的4.2埃分辨率的冷冻电镜结构,为理解其功能提供了重要的线索。


在此之前,虽然发现钙(钠)离子通道原核同源蛋白晶体结构,但它们的通道亚基是由四条相同的肽链组成的同源四聚体,并且没有辅助性亚基。因此为了更好地理解真核电压门控钙离子通道的结构与功能,诸多科研工作者一直致力于解析真核钙离子或钠离子通道的结构,但由于技术难度,此前只有低分辨(~20埃)的电镜结构。


根据上述颜宁2015年刊发的论文,其已经解析了肌肉兴奋收缩通路上的膜蛋白,包括电压门控钠离子通道(细菌同源蛋白NavRh)、电压门控钙离子通道、以及最大的钙离子通道RyR1的结构,从而为理解这一基本生理过程的分子机理打下重要基础。


据清华大学新闻网,2016年9月1日,颜宁研究组又刊发《电压门控钙离子Cav1.1通道3.6埃分辨率结构》(Structure of the voltage-gated calcium channel Cav1.1 at 3.6 angstrom resolution)的研究长文,报道了首个真核电压门控钙离子通道的近原子分辨率三维结构。


该研究报道的3.6埃电镜结构,相比前述的4.2埃尽管在数字上看似进步不大,却有着质的飞越。在该结构中,大部分氨基酸的侧链能够被清晰分辨,从而可以据此搭建出准确和完整的结构模型。新的结构揭示了大量新信息,更新了科研工作者对电压门控钙离子通道的认识。


根据颜宁2016年刊发的论文,颜宁研究组已经成功解析了肌肉兴奋—收缩偶联通路上的两个关键膜蛋白Cav1.1以及RyR1的结构,从而为理解这一基本生理过程的分子机理打下重要的结构基础。也可以说,颜宁的科研成果为理解为数众多的具有重要生理和病理功能的电压门控钙离子、钠离子通道的工作机理奠定了基础。


实际上,结构生物学科研工作者的最终目标并不是将一个又一个蛋白结构观察出来,而是寻出自然规律利用氨基酸序列直接预测蛋白空间构象,而以AlphaFold2为代表的AI技术正是与前述两种实验手段相辅相成。


颜宁表示,结构生物学不仅仅是看到折叠(Fold),更要理解蛋白质的动态变化,要理解与其他生物大分子或者调节小分子的相互作用,要理解在细胞原位里的状态,这些都是AI目前尚无能为力的领域,因为尚没有足够的数据库去训练它。举个例子,其团队Cav2.2的结构去年发表晚了,尚未放在数据库里被AlphaFold用来训练,所以它预测的模型就与实验结构严重不符。


一位生物医药人士曾向界面新闻表示,以AlphaFold2为代表的AI蛋白结构预测算法,还没法取代结构生物学的湿实验。AI技术的确预测来几乎所有Uniprot(蛋白质序列与功能信息数据库)中的序列结构,但这些预测模型的质量仍良莠不齐。


湿实验指的是在实验室里采用分子、细胞、生理学试验方法进行研究,也就是传统的药物研发实验室;而干实验则是通过计算机模拟及生物信息学方法来进行研究,也就是AI平台做的事情。


另一位生物医药人士也向界面新闻表示,AI只能是补充手段,可以减少确定结构过程中的很多麻烦,但最终仍脱离不开科研人员的实验验证。“即使你基于当前模型,预测的准确率达100%,也不能在不进行湿实验的情况下确定该结构的准确性。”


本文来自:界面新闻,作者:李科文