摘要:在本期的节目中,BioSpace洞见部门主管Lori Ellis与Cresset公司人工智能副总裁Mutlu Dogruel及首席科学官Mark Mackey共同探讨了临床试验失败率问题,以及人工智能在降低临床前成本方面的潜力。

原文:Lori Ellis, BioSpace Insights. August 21, 2025. Why AI Won’t Save the 90% of Clinical Trials That Still Fail
编译:肖高铿
在本期《Denatured》节目中,BioSpace的Lori Ellis与Cresset的专家Mark Mackey和Mutlu Dogruel共同探讨了AI在降低药物研发成本与失败率方面的潜力与挑战。在本文中,我对原声播客进行了小节划分,并加了标题,对谈话进行了中文翻译。
嘉宾
- Lori Ellis (主持人), Head of Insights, BioSpace
- Mark Mackey, Chief Science Officer, Cresset
- Mutlu Dogruel, VP of AI, Cresset
开场与核心问题
Lori Ellis:
大家好,我是Lori Ellis,BioSpace的洞察主管。您正在收听的是《Denatured》节目。
当谈到人工智能的未来时,总是有很多炒作和很多问题,但有一个根本性问题:人工智能会改变目前高达90%的临床试验失败率吗?
本期节目的嘉宾将探讨这个问题。他们是Cresset的首席科学官Mark Mackey和人工智能副总裁Mutlu Dogruel。
在药物设计中,应该在什么时候使用人工智能?是未来还是现在?此外,能否再谈谈您希望目前看到哪些进展?
定义“AI”:历史、现状与炒作
Mark Mackey:
Lori Ellis 插话介绍:这位是Cresset的首席科学官Mark Mackey.
Mark Mackey:
关于AI在药物设计中的应用,你需要对你所说的“AI”具体指什么谨慎一些。因为AI是一个庞大、宽泛的术语,包含很多东西。
但如果回溯历史,其实早在1990年代,我就在使用神经网络进行某种性质的机器学习预测了。当然,那时的网络非常小,与现在构建的庞大系统相比简单得可笑,但基本概念是相同的。所以,是的,人工智能和机器学习确实并不新鲜,每个人都已经使用它至少30或40年了。每一家制药公司都有数据科学和建模团队,他们几十年来一直在做这些事情。所以这更多是程度的演进。我们现在有更强大的技术可用,但并非突然就能做以前完全无法做到的事情。
在蛋白质折叠等领域确实出现了阶跃性的进步。但我认为我们需要警惕生物技术领域的一些炒作,比如声称AI将完全自主设计药物,你只需合成分子即可。我认为部分目标或许可以实现,但仍存在一个巨大障碍:我们根本还不完全理解生物学。
生物学理解:AI无法逾越的根本障碍
Mark Mackey:
我可以设想一个运行完美的AI系统,我想治疗阿尔茨海默病,所以我设计一个β分泌酶抑制剂。我按下按钮,分子就设计出来了。过去十年,有大量分泌酶抑制剂进入临床试验,花费了数百亿美元测试它们。它们都能有效抑制酶,但对阿尔茨海默病却无济于事。
这是因为根本的生物学问题:我们仍然不知道淀粉样蛋白前体蛋白是导致阿尔茨海默病的原因,还是阿尔茨海默病导致了它的沉积?我们不知道答案。人们赌它是病因并投入巨资,却几乎总是失败。AI在这方面完全帮不上忙。
所有临床试验中有一半因缺乏疗效而失败,大多数情况是因为我们原以为抑制某个蛋白能治病,但结果发现错了。这不是我们已知但未整合的信息,而是我们根本未知的信息。因此,问题的关键在于,虽然AI或许能加速设计出抑制某个特定蛋白的分子,但这是否真能大幅增加上市新药数量?我表示怀疑,因为将药物推向市场的最大问题不是找不到分子,而是靶点本身是错的。
即使抑制了蛋白,它是否如你所愿?它是否还有其他未知的致命副作用?因此,我认为有一个根本问题:AI可以带来效率提升,但能否改变90%的临床试验失败率?我看不到任何能巨大改变这一现状的东西。我们或许能从90%降到85%(这已是50%的盈利能力提升),但仍意味着5/6的临床试验会失败。大多数失败是因为我们不理解生物学,而生物学真的非常复杂。
AI的当前价值:效率提升与“低垂的果实”
Mutlu Dogruel:
Lori Ellis 插话介绍:这位是Cresset的人工智能副总裁Mutlu Dogruel。
Mutlu Dogruel:
我想我同意Mark的观点。看看AI当前的应用,它主要用于针对一个已知靶点筛选数十亿虚拟分子(而物理实验需数十年的工作,现在几小时即可完成),并进行分子性质预测。当我们说AI时,它当然涵盖机器学习模型,不必是大型语言模型。这些是真正的“低垂的果实”。
本质上,AI可用于帮助我们在计算机屏幕上快速终止没有前景的候选药物。这并非小事,它是一种切实的、显著的效率提升,在hit-to-lead阶段实现了“快速失败、廉价失败”的理念。
未来愿景:干湿实验室融合的智能学习有机体
Mutlu Dogruel:
但同时,这只是第一步。我们努力的方向不是AI取代湿实验室,而是干、湿实验室的结合,是将它们完全融合成一个单一的智能学习有机体,在某种意义上是一个用于分子的自驱动实验室。
流程是:用AI生成候选分子,用AI根据某些性质缩小选择范围,然后送到湿实验室(甚至可用机器人和AI自动化合成),AI建议实验,实验结果反馈给AI进行进一步迭代。这就形成了一个假设-实验-学习的循环。过去一个发现团队需要一年甚至十年完成的工作,理论上可能在几周内完成。当下,这些闭环、自驱动实验室的基础正在建设中。
Mark Mackey:
某种程度上,这在AI热潮之前就已发生。AI的一大影响将是:许多我们以前能做但计算成本高昂的事情,现在可以大规模进行了。AI非常擅长构建近似函数。例如计算体系的能量,量子力学方程已解决了此难题,但求解需要大量时间。如果你有足够的样本去训练AI以“猜测”能量,它能做得非常好,将耗时数小时或数天的计算缩短到几秒钟内给出99.99%准确的答案。这是一个巨大的生产力提升,使得我们以以前无法实现的规模开展工作。
工作流使得手工作业更少,分子由半自动算法设计并经其筛选,人脑只在最后介入,只需审视那些已经过充分验证的10个好想法,而不是一群人围着白板草图决定合成什么。这本质上是吞吐量更高、自动化程度更高的过程。
监管、风险与AI的局限性
Lori Ellis:
所以听起来,尽管AI炒作很多,但你们提倡的是一种干湿实验室结合的态度,可以做得更好、规模更大,但至少现在,完全自主设计药物还不现实。
Mark Mackey:
是的。这又回到你在药物研发管线中的位置。AI辅助的是研发早、中期阶段你担心的问题。早期阶段关乎生物学和靶标验证。很多公司想用AI分析生物文献来发现新靶点,我认为这将非常困难,因为文献混乱、嘈杂且存在错误。一旦有了靶点,开发分子来命中它,这个阶段肯定适合加速。
但难点在于:你有了命中靶标的分子,但靶标是对的吗?化合物有毒吗?它在人体内是否有正确的性质?我需要一种药,每天服用1-3片。如果每半小时服一片,那不是药。如果服用后产生不可逆的严重副作用,那也不是药。所有这些系统性的生物学特性,我认为在可预见的未来都难以预测,只因我们没有足够数据。AI是数据饥渴型的,预测肝毒性等终点的现有数据量极少,远不足以训练任何深度学习模型。所以AI在这方面无能为力。
在临床前阶段,AI绝对有益。这实际上对生物科技公司更有利,因为效率提升意味着你不必像以前那样需要那么雄厚的资金才能将化合物推进到一期临床。但这仍然昂贵(可能从5000万美元降到500万或2000万?),但要知道,将化合物推到上市可能需要10亿美元。临床试验部分不会消失,因为我看不到监管机构会接受仅凭AI模型就认为药物安全无需人体测试的未来。这是一个科学问题,也是社会风险承受能力的问题。
Lori Ellis:
美国有人讨论或许淘汰动物模型,直接从AI进入人体试验。您认为这可能吗?
Mark Mackey:
欧洲曾大力推动用计算模型替代动物实验进行一般化学毒性测试(非药物)。监管机构设定了高标准(如模型需98%准确率),但没有一个模型接近此水平。它永远也达不到,因为这归根结底是风险偏好问题。监管机构完全有理由不愿承担风险:万一计算机模型说这东西能喝、没问题,结果却导致癌症,等病例在医院出现时就为时已晚了。因此,我们离那一步还很遥远,因为模型不够好,社会的风险承受能力也不允许。
AI对生物科技公司与大型药企竞争格局的影响
Lori Ellis:
考虑到所有挑战和好处,生物科技公司有哪些机会与大型制药公司竞争?
Mark Mackey:
是的,正如我提到的,优势在于:对于许多我们能建立良好模型的性质,AI意味着用更便宜的计算取代昂贵的湿实验,即整个过程的数字化。最大优势是它降低了行业壁垒,提高了生物技术公司的成功机会。
大型药企往往更“偏执”,对化合物进入临床的标准有着长长的审查清单(不仅要与靶标结合,还要可溶、可吸收、不被肝脏过快代谢等)。根据我的经验,大药厂对化合物何时真正准备好进入临床更加谨慎。而许多生物科技公司则更愿意说:“嗯,这个化合物不完全符合所有标准,但很接近了。我们没钱了,投资者不耐烦了。钱刚好够做一期临床试验,就推进去吧,希望成功。成功了公司得救,失败了反正也是破产。”
生物科技公司在这方面一直更“灵活”。但AI模型的优势在于:用同样的钱,你可以做得更好。现在的发现预算不再局限于合成和测试几百或几千个化合物,我们可以计算筛选数万甚至数十万个化合物,寻找具有理想属性的分子。这意味着湿实验预算能发挥更大效用,我们合成的无用化合物更少。因此,当我们资金短缺、不得不将化合物推进一期临床时,它是一个更好的化合物的可能性增加了,更可能在不出现糟糕药代动力学和初步显示药效方面取得成功。
Mutlu Dogruel:
我认为小型生物科技公司绝对会从AI中受益匪浅,因为AI是伟大的均衡器。
几十年来,药物发现一直由拥有庞大基础设施、巨大化合物库和大量研究人员的大型制药公司主导。AI将稍稍改变这种局面,有利于小型生物科技公司。
如果你是一家敏捷的生物科技公司,拥有优秀的团队、独特的生物学见解并能使用强大的AI工具,那么你现在可以更方便地在发现阶段与制药巨头竞争。
正如Mark所说,计算机模拟(in silico)发现的进入门槛从未如此之低。他们可以从第一天起就AI原生(AI-native),围绕新范式构建整个发现过程,没有遗留系统的包袱和官僚主义,他们绝对可以智胜更大或更官僚的组织,专注于以前被忽视的罕见病或不可成药靶标。这种敏捷性给了他们显著的竞争优势。
挑战与瓶颈:数据依赖与“黑箱”问题
Mutlu Dogruel:
但从负面来看,我完全同意Mark关于毒性等AI不适用的任务的观点,存在真实挑战,我们需要诚实面对。
例如黑箱问题:我们不能总是完全理解AI为何做出某种预测,这将造成信任鸿沟,可能减缓采用速度,尤其是在做数百万美元决策时。可解释性是一个巨大的研究领域,短期内无法完全解决。
其次是数据依赖性。AI模型的预测完全取决于其最初是如何训练的。垃圾进,垃圾出(Garbage in, garbage out)的原则比以往任何时候都重要。我们模型的好坏取决于我们用于训练的最后的高质量、精心整理的数据集。获取专有的实验数据仍然是整个行业的主要瓶颈。我们每天都面临这个问题。当我们说“让我们创建X预测器、Y预测器”时,第一个问题就是:“你有高质量数据吗?”答案通常是从“没有”开始。我们必须去寻找或授权获取好的数据。
Mark Mackey:
这其实是AI对现有大型药企有利的地方。作为生物科技公司,你通常无法获得公共领域之外的数据。各大药企几十年来一直在内部收集并运行各种测试,拥有海量的物理、化学性质数据(例如2万到5万个溶解度测量值等)。他们可以用这些数据构建预测模型。这些数据集并步公开,而训练AI模型需要大量数据。大公司拥有这些数据,小公司没有。
结束语
Lori Ellis:
我要再次感谢我的嘉宾们为此付出的时间和分享的见解。也感谢Cresset使这两期节目成为可能。