本文来自微信公众号:Nature Portfolio(ID:nature-portfolio),作者:David Cyranoski,原文以AI drug discovery booms in China为标题发表在2021年8月3日的《自然-生物技术》的新闻版块上,头图来自:视觉中国
中国研究人员密切关注人工智能(AI)的药物设计和开发潜能。上月,三家中国制药商筹集巨资,为他们的药物研发计划提供资金。Insilico Medicine是一家总部位于香港、全球一半业务在上海的公司,筹得2.55亿美元以推进其AI开发候选药物进入临床试验,并调整算法寻找新靶点。此前,北京望石智慧(StoneWise Technology)于四月获得1亿美元投资,深圳晶泰科技(XtalPi)于去年九月收获3.19亿美元投资。
腾讯、百度及字节跳动等IT巨头也将他们强大的AI实力转向应用于药物设计。通过着力发展AI优势的国家政策、拥有众多合作的合同外包研究组织(CROs)、并不断健全健康数据隐私保护措施,中国人工智能公司已蓄势待发参与全球竞争,以更快、更便宜的方式生产更多药物。但是,即使14亿人口能够提供丰富的数据,让中国人工智能公司领先于西方同行,用于训练公司算法的临床前和临床数据的质量仍然存在问题。
Insilico Medicine创始人兼CEO Alex Zhavoronkov说:“如果你来到中国,看到正在发生的一切,这将会让你印象深刻。”位于北京的创新工场(Sinovation Ventures)是一个投资AI企业的风险投资公司,其CEO李开复表示“中国在建立药物研发系统方面确实拥有最先进的能力”。
但中国的AI药物开发才开始起步。在过去的10年里,像Atomwise、BenevolentAI(伦敦)、Exscientia(牛津)、Relay Therapeutics和Numerate这样的公司与多个国家的制药企业进行了大额交易。
即使是现在与中国有关联的两家最著名的AI药物设计公司——Insilico Medicine和晶泰科技——都是2014年在美国成立的。那时,中国的AI药物研究进展缓慢。晶泰科技联合创始人马健说,“当我2015年第一次回到中国,和中国的制药企业交流时,我发现很明显大多数企业对AI药物研发没有什么兴趣,或者没有准备好进入这一领域。”
但从那时起,整个环境发生了快速的转变。AlphaGo在2016年和2017年战胜人类围棋顶级选手,使行业关注到人工智能成为许多中国年轻人心中成功之路的潜力。次年政府推出了一个雄心勃勃的规划,旨在使中国到2030年成为人工智能领域的全球领导者,这一举措影响深远,包括新出现的大学训练项目。
与此同时,中国的监管改革促进了包括基于人工智能在内的创新药物发现。2015年更新的生物等效性规则和新的批量采购规定意味着,创新药物越来越受到青睐,而此前仿制药曾主导中国药品市场。新规则的天平偏向了最快和最具前瞻性的制造产业。这就产生了对新管道的巨大需求,随之而来的是人们的好奇,想知道人工智能能带来什么。
例如,2019年豪森药业(Hansoh Pharmaceutical Group)同意向Atomwise支付可能超过10亿美元的费用,用于设计靶向肿瘤和其他疾病的11种蛋白质的药物。虽然晶泰科技的大部分合作资金来自美国公司,但中国现在是其增长最快的市场。马健说,“因为(中国)企业创新经验不足,AI成为一种跨越差距的方法。”
中国的研究者们也响应号召。在上海交通大学拥有一间分子设计实验室的张健,与多家AI药物设计新企业合作过。他说在“行动风暴”中,计算机科学家、物理学家、数学家和传统药物发现研究人员成立了50多家AI药物研发公司。2019年,张健帮助上海宇道生物(Nutshell Therapeutics)重定位为一家人工智能药物设计公司。6月,宇道生物刚刚完成其2000万美元的融资。2018年,百度搜索引擎变革的关键人物周杰龙建立了望石智慧(StoneWise)以助力小分子药物的研发。
美国的药物行业从业者和药物研发人员对这股AI热保持怀疑态度,不相信在一个药物项目达到人体概念验证研究阶段时,AI可以改善损耗。中国研究人员认为,考虑到这种保守的思维,中国企业或许能够比西方企业更快地利用人工智能。宇道生物联合创始人郁征天认为,“中国没有做这类发现的传统,所以也就没有条条框框。人们心中没有太多外在规则”。这家公司利用AI来预测疾病靶点的变构特性。
中国拥有巨大的人口和众多的医院,因此就可以轻松获得AI训练所需要的重要条件——大量数据集。而且人们对隐私的顾虑不那么重,因此可以很轻松获得需要的数据。李开复说,美国AI公司特别受到法规的束缚。如1996年颁布的《健康保险可携带性和责任制法案》(HIPAA)为如何共享电子医疗记录设定了标准。李开复补充道,即使患者已经同意,HIPAA仍然使数据难以汇总。
虽然中国政府即将对出售泄露个人信息的个人采取严厉的惩罚措施,但像医渡云(Yidu Cloud)这样的公司正在出现,以确保这些数据能够被访问。医渡云将知情同意的患者数据整合到一个研究工具中。美国的Flatiron Health、 Tempus、 Aetion和 Palantir也在大规模整合真实世界的电子健康记录数据,用于药物研发。
但是许多数据质量不高,会误导AI训练。叶涛是北京大学深圳研究院的药物化学家,他运用计算机辅助药物设计。他说:“数据质量极为关键,许多研究药物发现的中国公司并没有高质量的数据可训练AI。”
张健同意数据质量很重要,尤其是在北京和上海这类医学研究中心之外的地方。他说:“可能只有大城市才有可能获得质量好的数据。这是有些复杂。”
中国有强大的AI研究人员:从欧美回国的人;百度、阿里巴巴和腾讯的行业研究资深人士;以及那些在支持该国长期人工智能目标的新政府项目下接受培训的人,都会给这个国家的行业带来竞争优势。斯坦福大学一份近期报告显示,在全球AI研究论文中,中国研究人员占22.4%,欧洲和美国的这一比例分别为16.4%和14.6%。去年,中国AI出版物的引用量首次超过了美国。
李开复说,从排名前1%的论文,尤其是高被引用次数最多的会议论文来看,中国尚缺乏能取得根本性突破的科学家。他说:“就最具创造性的创新思考者而言,美国仍处前沿。”
但这对药物发现领域来说不是什么大问题。中国公司可以摆弄基于生成对抗网络或生成合作网络的人工智能算法,这些算法大多是在美国、加拿大或欧洲开发的,因为它们通常是开源的,可以公开访问。“你改变了几个词,就改变了整个概念。你可以找到解决自己问题的方法。”郁征天说,“科学来自那里(西方),但技术来自这里。”
李开复说,中国人工智能药物研发的方法可能也更务实,他认为这给了中国一个优势。DeepMind(谷歌的子公司)解决了数十年来的蛋白质折叠之谜,能令研究者震惊,兴许会赢得诺贝尔奖或者图灵奖;而中国的公司则“非常擅长利用人工智能赚钱,用人工智能创造价值,用人工智能打造新产品”。
然而,人们对AI的兴趣和机会的爆炸式增长推高了工资水平,也使得留住专家变困难了。Zhavoronkov说,中国顶尖的人工智能专家比在美国更贵,而且往往会四处跳槽。Insilico的研究范围从生物学假设和新生物靶点的识别,延伸到候选分子的生产和测试,主要聘用中国大陆以外的AI专家,在后期的化学设计和分子生产方面则更多地依赖中国的研究,中国在这些领域尤擅胜场。他说“我们做地理套利”。
Zhavoronkov说,中国有3000来家合同外包研究组织,可能是中国AI药物研发公司最吸引人的方面。Insilico与80家合同外包研究组织展开合作。这使该公司避免了与学术机构合作时可能发生的时间和知识产权损失。这也允许他们在多个合同外包研究组织在开发链中并行运行多个实验。他认为比较结果“对AI来说是一个巨大的学习经验”。
“你可以同时有大量的实验室以合适的成本为你进行所有实验。”他说,“只有在中国你才能这么做。”
到目前为止,和西方同行一样,Insilico和晶泰科技已经达到了一些临床前里程碑。Insilico公司发现了一种与特发性肺纤维化有关的生物靶点,然后从头开始设计了一种“新颖”的分子(至少新到足以申请知识产权)匹配该靶点,并有望治疗该疾病。根据该公司的新闻稿,这一创新仅用不到18个月,花费了200万美元——仅占此类阶段常规成本的一小部分。
根据晶泰科技的新闻稿,其与Signet Therapeutics的合作在6个月内确定了一种胃癌治疗方法。该公司表示,目前正在向临床试验迈进。上海交通大学的张健说,他研究的两种化合物正在等待批准开始临床试验;他预计其中一项试验将于明年开始。而郁征天说,与此同时,宇道生物的肿瘤学候选药物距离临床试验还有几年时间。
但与其他国家一样,人工智能药物设计在中国的成功将取决于其候选药物能否在临床取得成功,而目前还没有人工智能设计的药物能做到这一点。新墨西哥大学的计算生物学家Tudor Oprea说:“现在有很多炒作,很多人试图向你兜售根本不存在的东西。这都有待实践的检验。所以只有上市之后才有谱。”
Oprea说Insilico有一个很有前途的模型(他为其担任科学顾问),因为其采用了“端到端”的验证过程,而其他许多模型只关注谜题的一小部分,因此很难知道AI是否给出了有意义的结果。他说“有许多视野太窄”。
腾讯、百度和字节跳动进入AI药物研发领域,将为中国的努力增加砝码。2020年7月,腾讯推出了自己的AI药物设计平台iDrug。它已经启动了十多个项目,包括寻找对抗新冠病毒的药物。该公司计划覆盖所有临床前研究范围,预测蛋白质结构,筛选候选蛋白,设计和优化分子,并表征蛋白质的功能。
李开复说这些IT巨头将扮演中国版谷歌的角色,生产出像DeepMind这样可以解决蛋白质折叠等问题的巨型机器,这要求比小型初创公司强大得多的计算能力。“于是我们既有小而灵活的公司,他们可能更务实,产生效益更快,然后也有巨头。”李开复说,“这种分工很好。”
尽管中美之间存在一些良性竞争,但许多研究人员更担心,当前政治上的紧张局势可能会损害两国在这个新兴领域互惠互利的协同效应。中国AI药物设计的大部分投资来自美国,而那些有影响力的AI会议论文作者中,有三分之一在中国接受教育,但大多在美国工作。李开复说:“所以我真的希望,医疗保健或药物发现不会陷入这种分歧,因为这类研究有益人类福利。”
© nature, doi: 10.1038/s41587-021-01016-0
本文来自微信公众号:Nature Portfolio(ID:nature-portfolio),作者:David Cyranoski