本文来自微信公众号:健识局 (ID:jianshiju01),作者:烟酰胺,题图来自:视觉中国


无处不AI,就连临床试验也不例外。


芬兰阿尔托大学(Aalto)披露,2022年2月,拜耳与该大学合作,尝试靠AI技术创造临床试验中的“虚拟”对照试验组。


理想情况下,“对照组不需要招募患者,同时还能提高药物开发的成本效益”,阿尔托大学人工智能中心的Harri Lähdesmäki教授表示。


在药物研发至上市这一长线流程中,AI主要聚焦在更可控的制药前端。据《全球44家顶尖药企AI辅助药研行动白皮书(2021年)》,按照制药阶段来分,这些药企中2/3的AI业务均在药物发现阶段,能够介入到后期临床试验的AI项目少之又少。


如果能靠AI虚拟对照组,医药研发领域就能挺进新时代。问题是,这靠谱吗?


患者招募困境


拜耳的这个项目于2021年5月启动,名为“未来临床试验”。项目为期3年,第一期由拜耳和阿尔托大学联手,第二期于2022年2月启动,并加入了赫尔辛基大学医院(HUS)


让我们算一笔经济账。当前,新药研发成本超过10亿美元,其中最昂贵的就是最重要的临床3期试验,2014年平均成本高达2.55亿美元。有研究显示,每个招募的患者花费超过4万美元。


还有时间成本。临床试验是一个体力活,在10年研发周期中,临床试验可能长达7年。


此外,设置对照组常常涉及伦理问题。服用安慰剂而非药品,这让很多没有特效药的罕见病患者难以接受。


就算以上都不是问题,还有患者招募这个大难题。


招募人数不足正引起行业的关注。据统计,新药研发过程中近90%的药物会在进入临床试验后失败,其中,近三分之一的3期临床试验因患者招募而失败。


对于人口稀少的北欧国家,患者招募难题尤为严重,这也是前述项目将在芬兰进行的重要原因之一。


例如,在最热闹的PD-1/PD-L1领域,入局者众多,精准治疗要求下符合临床要求的患者越来越少。据美国癌症研究发布数据,2014年到2018年间,肿瘤免疫疗法试验的月招募率下降66.96%。


热门赛道尚且如此,在发病率极低的罕见病领域进行患者招募就难上加难。


“AI技术作为一个好帮手,在减少临床试验对招募患者的需求上是有前景的。”北京大学第一医院医学统计室主任姚晨对健识局表示。


一场单臂试验的梦


前述AI项目中的虚拟对照组,其实属于外部对照组。


理想情况下,临床试验应该为双臂试验:一组为试验组,另一组为对照组。但在特殊情况下,某些病症患者极少,不满足开展双臂试验的要求。此时产生了另一种方式:单臂试验。在单臂试验中,仅招募一组当下的病人作为试验组,然后,基于病历登记、医保数据或大型人群队列等外部数据资源库,设立外部对照,来进一步控制偏倚,增强研究结果的可解释性。


在拜耳这个项目中,芬兰当地最大的医疗服务机构赫尔辛基大学医院负责提供患者数据,阿尔托大学负责开发机器学习工具,用以对不同时期收集患者的数据进行建模。


难题在于受试组和对照组数据的可比性,因为数据可能仅部分有重叠,且测量变量不同。关于某种病患的记录多样,其中难免会有一部分因历史与当下差别太大,因而不具备可比性。


如何在茫茫外部数据中找出最优可比项?AI要比人更擅长做这件事。


“这是单臂试验中的重要环节,需要预选根据外部数据确定试验的单组目标值,但研究者任凭经验是不可靠的。”姚晨向健识局解释,一来是无法对巨大的外部数据分析面面俱到分析,二来容易因研究者自身带有喜好偏差,进而影响到数据对比的客观性。因此,这个环节若有AI的介入,就能很好地提高效率。


但数据质量是关键。姚晨指出,用以训练AI技术的真实世界数据质量的高低,才是最影响试验好坏的根本源头因素。


数据完美,可能去掉试验组吗?


只要底层数据质量高,就能去掉对照试验组吗?


“在循证医学的前提下,我认为AI辅助下的虚拟对照并不具备替换真实对照组的可能。”姚晨坦承。


循证医学始终在论证因果关系,而非关联关系。在新药临床试验中,临床试验方案中通常采用随机分组方法对某些已经或未知影响因素进行“控制”,进而找到治疗药物和临床结局之间的因果关系。


而利用真实世界数据进行研究,由于无法实施对受试对象进行“随机对照分组”这一动作,进行对比分析时受混杂因素的影响,得到的通常是药物与治疗结局的关联关系。


对于某些罕见疾病来说,为了保证患者能最大程度得到救治,监管部门会有条件地“认可”基于某些虚拟对照的关联关系假设。但必须要承认的是,含有真实对照组的确证性临床试验仍旧是新药研发的重要支撑。


除了医学研究本身的要求之外,商业上必要经历的合规也是一座难跨的大山。


“利用AI技术建立虚拟对照组,越来越受到临床试验研究者的关注。但它能否落实到现实中,重点在于监管部门是否接纳。”AI制药公司英矽智能创始人兼首席执行官Alex Zhavoronkov对健识局表示。


全球推广的难度更大。Alex指出:即便是相关项目取得成功,也暂时没有全球扩张的潜力。但有两个市场比较重要,“中美两地的动向会引来其它地区的跟随和效仿。”


在国内,海南博鳌乐城国际医疗先行区就借用真实世界数据推动相关产品获批上市:结合国外上市产品临床试验数据,或国内同类产品使用的真实世界数据等已有外部数据资源,形成虚拟(外部)对照组,增加进口药械产品在中国注册审批上市的新途径,加快相关产品在国内广大人群中的可及性。


2020年3月26日,在完成真实世界临床数据采集、分析、审评等工作后,跨国药企艾尔建公司的青光眼引流管产品通过国家药监局审批在国内上市,总历时不到5个月。如果通过传统临床试验,这类产品至少需要2年到3年的时间才能在国内上市。


要将AI技术深入到临床试验,国内还有很长一段路要走。毕竟,象征着真实世界数据的电子病例的规范和运营还未全面完成,互联网AI诊疗也有待强监管和规范,部分AI辅助治疗技术仍处于限制类临床技术类目中……


国际上,2020年9月,《柳叶刀》《自然医学》《英国医学杂志》联合发布了第一份AI介入临床试验的国际标准,这是首个用于规范AI临床试验的国际标准,不过仅适用于医疗影像类项目,其它项目仍需探索。


由于本身的信息更为规范化、技术更为成熟,成像类AI产品更加具备深入渗透到临床试验中的可能。如医生可以用AI视觉处理技术来分析癌症组织切片;涉及CT或MRI核磁共振,借助AI技术来进行决策等。


Alex表示:“那些专门关注成像数据的AI应用于临床试验有较大想象空间。在成像数据分析方面,人工智能已经超过了人类。


AI的真正角色


事实上,AI在临床试验中的作用不应理解为“消除”对照组,而在于更好地开展对照试验。当然,前提仍然是拥有足够多高质量的真实数据。


现阶段更现实的做法是:利用已有的临床试验数据,对新临床项目进行成功率的预测。在已有数据的基础上,AI在交叉验证、回顾性验证、准前瞻性验证等方面的预测优势正在凸显。


“我们曾用2015年之前的数据来训练AI算法,再对2015年到现在的一些临床试验进行AI预测。结果是,预测临床试验成功的准确率约为87%,预测临床试验失败的准确率约为90%。”Alex表示。


更重要的是,高准确率的背后是对既往数据的经验总结。利用AI来理解既往药物临床试验的成功和失败,这对于接下来临床试验的推进也是种借鉴。


除此之外,临床试验中的方案设计、数据收集、患者招募、方案的运营等,都成为AI可介入的环节。



健识局整理:部分AI+临床试验公司


值得注意的是,比起AI介入药物发现,AI介入临床试验在压缩时间成本上成效不大。


业内相关人士表示,AI介入药物发现,或许可以将发现时间从10年压缩至3年,甚至更短;但AI介入临床试验带来的提速效果则非常有限。


眼下,AI技术仍旧是帮助人类完成复杂、繁琐、重复性高工作的替代者,但无法替代同期开展的随机对照试验。


拜耳集团数据科学家Jussi Leinonen也承认,AI不会在临床试验中完全取代人类,也不会作出独立决定。


本文来自微信公众号:健识局 (ID:jianshiju01),作者:烟酰胺