英伟达在生命科学领域的野心藏不住了。


生成式 AI 兴起后,英伟达的CEO黄仁勋频繁在公开场合谈论生命科学,宣称“生命科学工程化”即将来临。事实证明,老黄不玩虚的——在刚刚落幕的英伟达2024年GPU技术(GTC)大会上,医疗健康和生命科学大火了一把,有业内人士统计,总共900多场活动中,至少有90场与该领域相关。


尤其是在 GTC 开幕当天,黄仁勋一口气正式推出了25个医疗、生物制药相关的“微服务”,覆盖医学影像、药物研发和数字健康等领域。其目标是让“全球医疗企业能够在任何地点和任何云上充分利用生成式 AI 的最新进展”。


在此之前,业界对英伟达的认知,更多集中于“卖卡的”。“算力,特别是GPU是训练AI模型必不可少的生产资料。”百图生科首席技术官(CTO)宋乐告诉虎嗅。


而英伟达的布局显然超出了一个硬件供应商的“本分”。从公开数据看,这家全球芯片巨头已经与超2500家相关企业达成合作,包括提供算法的AI企业,也包括医疗、制药领域巨头。比如:与强生开发了可实时分析数据的手术机器人,与GE开发了可以“自动”给患者拍片的“天眼CT”。


最近一年,英伟达更是通过投资等方式,将至少10家AI制药领域头部公司纳入麾下。


这不是科技巨头第一次进军生命科学领域,但 2024 这个时间节点,与英伟达这家企业本身,都有着某种特别的含义。


“像英伟达这样,将在医疗领域的布局提到战略地位,可能在业界还是第一次。”浙江大学药学院教授谢昌谕告诉虎嗅。


医疗领域,不相信算法


对英伟达医疗领域布局的洞察,必须追溯到生成式 AI 的发展本身。然而看似在技术、商业层面都有无限故事可讲的生成式 AI,在医疗健康领域,可算是踢到了铁板。


从产业的反应来看,目前AI在医疗健康领域还处于起步阶段,很多企业,特别是制药企业仍然在观望。有国内知名药企相关负责人曾公开表示,该公司引入大模型的工作,至今还停留在成本核算阶段。


这种迟滞性并不是某一家公司的问题。从数据看,全球每年有超2500亿美元花在新药研发上,其中投向AI制药的只有10多亿美元,预计到2026年也不超过30亿美元。


另据IDC的一项调查显示,医疗健康和生命科学相关企业中只有14%“已经在生成AI方面进行了大量投资,并在未来18个月内制定了‘通过培训获取GenAI增强软件和咨询服务’的支出计划”,远低于全球整体水平(34%),且只有制造业的一半。


与医疗企业对 AI 的疏离感迥然不同的是,技术供应商一直保持着极大的热情。数据显示,全球仅AI+生物医药公司就有700多家;在医疗健康领域,谷歌、IBM等巨头早就有所布局。尤其是ChatGPT 火起来以后,仅中国就一口气涌现了近50个医疗大模型,从ToB的医生助手到ToC的私人健康管家几乎全品类覆盖。


医疗健康就像一个冷静的“冰山美人”,“追求者”很多,但极其务实。她清楚地表示,算法只是一个小伙子的“发展潜力”,数据才能代表他的“背景与身家”。


而这恰恰是大部分技术供应商的痛处。


有行业投资人透露,因为难以获得好的数据,80%左右的医疗大模型没有进入第二阶段(即:投喂专业数据在某个领域增强),进入第二阶段的20%中,绝大部分也没有进行针对不同的场景、任务的高水平微调。


部分创业公司对内部医疗大模型进行评估时也发现,其能力仅达到“助手”级别,还称不上“同伴”。这导致AI在短期内无法独当一面,工作范围局限在导诊、辅助读片、写病历等。


在生物制药领域,AI在蛋白质结构预测、蛋白质生成,甚至抗体药生成领域都有很好的表现,但是这些仍然是临床前阶段。在最耗时、最费钱的临床试验阶段(该阶段开销占新药总研发费用的70%以上),还只能做一些招募患者、做记录等简单工作。对于新药研发成功率低等痛点问题,也没有实质性改善。


以百图生科为例。他们提出的长远目标是用 AI 来模拟生命系统,比如人体免疫系统,理想状态下可以更好地预测抗体药进入人体的情况。但在现实落地却很不容易。“要实现这个目标,就需要突破一系列多个尺度的AI建模问题。”


百图生科 CTO 宋乐告诉虎嗅,因为蛋白质领域数据相对较多——已经达到十亿规模以上,所以这一领域的进展最快,不仅能生成蛋白质,甚至可以按照多样化的设计目标来生成具有功能性的蛋白质,比如成药性较好的抗体药,催化效率比较高的酶等。


然而模拟生命系统工程中,不但涉及单个蛋白质分子的生成,还涉及到大量的蛋白质的相互作用、细胞内和细胞之间的相互作用等,但这方面的问题更复杂,相对来说数据处于稀缺状态,会需要持续的AI模型和实验数据获取手段的创新和突破。


“可以想象,蛋白质的数据会呈指数性的增长,生成设计的落地案例也会快速增长。但是这只是一部分,要模拟免疫系统,就需要其他层面也有同样多的数据,以及与其匹配的AI模型创新和迭代,有同样快速的增长。”宋乐说。


那么有了数据,AI 就能在医疗健康领域畅通无阻了吗?也不尽然。


比如,医疗领域的公开数据相对更多,获取方式更多元,AI+医疗在此的进展也更快。就在今年年初,谷歌推出了一款医学对话AI——AMIE(Articulate Medical Intelligence Explorer)。这款应用是继Med-PaLM、Med-PaLM2之后的又一个“AI医生”,甚至通过了图灵测试,表现可谓令人惊艳。


尽管从具体表现看,这款在心血管疾病等领域的诊断领域,可以做得比保健医师更好,但仍然无法轻易用到真实患者身上,哈佛大学医学院专家在接受采访时直言,医疗绝不是收集信息这么简单,“它关乎人与人的关系”。


在其背后,伦理问题、监管问题、制度问题,以及科学研究本身的进展限制,都是难以突破的障碍。可以说,被频繁提及的研究数据,只是一个准入门槛,AI+医疗健康和生命科学本质上不是要解决一个技术问题,而是一个综合性的社会问题。


谢昌谕向虎嗅表示,更强的硬件和算法对加速行业发展一定是有帮助,但是并不说今天多了1000台GPU,明天就可以跟你打包票说AIDD(人工智能药物发现与设计)会有一个怎样的进展。


人工智能也被用于提高手术机器人准确性、安全性等。

图为小观众在看单孔腔镜手术机器人剥鹌鹑蛋。

来自:视觉中国


英伟达版“曲线救国”


因此,像过往所有的技术服务一般,单纯由乙方独立研发,向甲方切割式地交付技术方案,是绝对不行的。医疗、医药行业专家必须参与到技术方案演进的过程中,这是AI企业在医疗、制药领域摸爬滚打、屡败屡战六七十年后,最终得出的结论。


在这种合作关系中,药械企业不仅是买单方,更是数据的生产方,他们不仅解决了谁来买单的问题,也为产品迭代提供了足够的数据。今天发展最为成熟的AI+医疗影像就是典型案例。


GE、西门子等巨头将AI与大型设备绑定,就人为地建立了数据挖掘机。CT机、核磁共振机只要每天正常工作,就可以源源不断为AI提供数据养料了。同理,在药品领域,没有谁比出资搞研发的药企更能理直气壮地收集数据,AI 企业如果能参与到药企的工作流程中,也有机会破局。


这道理大家都懂,但实际很难做到,原因也很质朴:药企不同意。


对于药企来说,这些数据太贵了。手握大量研发数据的大药企,每年研发投入都在数十亿美元的规模,默沙东、罗氏等研发传统悠久的企业,相关投入早就超过了百亿美元,且有逐年增长的趋势。这些靠重金砸出来的数据,不仅有机会成就爆款单品,在未来竞争中,也会拉开与竞争者的距离。


在医药市场竞争越来越激烈的今天,任何企业也不愿意轻易将数据贡献出来。在这种情况下,要想拿到企业、医院内部的临床数据,就只能为他们量身定制模型,让他们在“安全区”内感受大模型的威力。


只不过,这种操作成本也是极高的。有业内人士向虎嗅透露,在云计算推广过程中也出现过类似的情况,最终很多公司因为亏本严重不得不叫停相关业务。大模型定制成本只会更高,他认为,协议金额很可能必须达到10亿美元级别才能收支平衡。


英伟达对此的策略是“曲线救国”。


英伟达是建生态的一把好手,其在10多年前(2006年)就凭借CUDA(compute Unified Device Architecture,计算机统一设备体系结构)奠定了在芯片界的竞争壁垒。


简单来说,CUDA 是基于GPU设计的软硬件结合的通用计算构架。其优势主要有两个,一个是使用者可以直接与GPU结合操控芯片;二是CUDA架构为软件厂商免费提供开发工具,方便软件开发。前者大大降低了GPU的使用门槛,后者方便使用者的同时也悄悄挖深了“护城河”——随着“工具包”里的零件越来越多,其可替代性也大大降低。


由此形成的CUDA生态,将英伟达与AI深刻绑定,英伟达也借此逐渐甩掉竞争对手,实现了逆袭。


在进入医疗健康和生命科学领域时,英伟达大有将CUDA生态的成功经验照搬过来的势头。


按照英伟达公开信息,他们此次推出的25个微服务,实际上是以往“专业版”基础上的更易操作版本——这些微服务套件中包含了经过优化的NVIDIA NIM™ AI 模型和工作流,并提供行业标准应用编程接口(API),可用于创建和部署云原生应用。


也就是说,医院、药企可以根据自己的需求点击“按钮”直接满足在医学影像、自然语言和语音识别以及数字生物学生成、预测和模拟功能等领域的需求。


对于AI企业来说,英伟达的品牌背书、行业影响力等带来了更多机会。“它是一种导流的平台。”宋乐告诉虎嗅。百图生科于2023年加入了英伟达招募创业公司的“NVIDIA初创加速计划”,在今年的GTC大会上,宋乐还作为生态合作伙伴代表百图生科分享了三年来做AI+生物医药的经验。


而在另一边,英伟达也降低了大模型使用的门槛,方便传统的医院、药企使用他们提供的“工具包”——比如各种AI大模型等。随着工具包的逐渐丰富,以及产业合作方的习惯、依赖,形成新的难以替代的生态。


你很介意软件企业直接参与业务流程,共享数据?OK,我把“傻瓜式”工具卖给你,你自己来做。定制模型这种高成本的事情,英伟达是不参与的,不管药企、云计算企业双方怎么折腾,只要基于我的基础设施来做,这一商业模式就是成立的。


英伟达的算盘打得很响,但需要注意的是,CUDA 过去面对的是软件产业,这与医疗产业截然不同,如果仅是照搬 CUDA 的打法,那甚至都无法打开医疗市场。


相对互联网行业,医疗、制药非常传统和封闭,有其独特的流程。比如:在中国,想说服医院采购某种产品,不仅要经过复杂的流程,还需要找到正确的渠道。在被认为最需要AI的基层,很多医院的采购渠道掌握在个人或者小代理商手里,如果找不到他们,再好的产品也与之无缘了。因此,很多AI+医疗企业创业近10年也还没能盈利。


而且科技巨头“攻下”医院、药企阵地的决心,一直以来都很坚定,导致这一市场还没发展起来,已经成了红海了。


AWS、腾讯云、百度智能云等,都在这个赛道中“跑马圈地”,为了争取尽量多的合作者,甚至有国内科技公司的相关负责人公开直言“要将构建AI场景模型的权利交还给科学家”,这几乎就是在向对方剖白,可以不惜成本,满足对方一切定制化需求了。


此外,英伟达提供的“工具包”还停留在“大众版”的层面上,医院、药企如果需要“专业版”大模型,还是需要与AI企业合作。这也让类似CUDA生态的“护城河”很难形成。


长期以来,国内面向大甲方的生意,都在买方强烈的定制化诉求,与卖方的“亏钱能力”间左右拉扯。相比之下,英伟达的方式虽然轻巧,却很难满足医疗机构、医生的需求——他们通常更习惯接受积极上门推销产品的营销方式,缺乏主动找“工具包”训练数据的动力。


较早进入医疗行业的科技公司,帮助基层医院用远程技术提高诊断水平。

来自:视觉中国


或有调和成本之争的机会


英伟达的机会,更多是趋势性的——产业界对AI的主要行为是观望,但在态度上也承认,AI不再是可有可无的东西,它将从根本上重构生命科学产业。


上世纪80年代开始,新药研发的主战场从小分子化药转向了结构更加复杂的生物药领域,总药物筛选空间可以达到10的60次方之大,想要靠人力快速筛选出适合的分子几乎不可能了,这一问题在“低垂的果实”逐渐摘完、复杂药物研发成为常态之后越来越突出了。


AI在逐渐地变成生物医药研发中不可或缺的基本实验设备。”宋乐向虎嗅解释说。他认为,接下来生物药物研发对AI以及后面计算资源的需求量会越来越大。


如今应用AI技术,已经可以将新药研发中的探索临床前化合物的耗时从原来的4年缩短3/4,到13.7个月,甚至压缩到一个月或20多天。另据麦肯锡全球研究所(MGI)估计,生成式AI有望每年为医疗、制药产业带来上千亿美元经济价值。


来自:麦肯锡


这样的数据固然令人心动,但是这对每年全球销售额超过万亿美元的产业来说,还不构成致命吸引。前述提到新药研发最大的花销在临床试验阶段,AI在这一领域能做的还非常有限。同时,目前还没有任何一款由AI设计的药品上市,也无法证明AI可以提高新药研发的成功率。


因此,制药企业与AI公司合作的过程中,试探性的少量投入更多,且更倾向于在类似密码子优化的细节上合作。这让很多AI制药企业的商业化野心很难找到出口。


但这和英伟达有什么关系呢?至少在五年内,英伟达卖的仍然是基础设施,不是药物研发解决方案,让药企为态度买单先构建基础设施,比直接砸钱定制大模型靠谱得多。


况且在中国,医疗机构、制药企业对AI的需求还远不止于新药研发。


2018年以来,药品、耗材带量采购等斩断“以药养医”利益链条的改革,以及国家医保谈判、医保支付方式改革等医改新政,共同宣告了整个药品研发、生产、流通到使用环节暴利时代的结束。


在一轮又一轮的疯狂降价潮中,整个产业链上的任何成员,都必须精打细算、想方设法地降本增效。此外,在医药反腐风暴不断升级后,负责销售药品的流通企业,还要尽快找到合规的营销方式。


对于所有这些问题而言,AI堪称救命稻草。而英伟达是这个“稻草”上最为世人瞩目的企业。