摘要:本文探讨了代理型AI(agentic AI)在药物发现中的核心价值——不仅在于加速新药产出,更在于重构和优化研发流程本身。作者结合亲身经历指出,AI可通过自动化繁琐任务(如靶点分析、分子对接、工作流编排)显著提升效率,并通过整合多源数据(专利、文献、物理模型等)增强决策质量。尽管人类专家在关键节点的判断仍不可替代,但AI可大幅提高供人工审查结果的信噪比,实现“快速失败、尽早优化”的药物研发理念。作者强调,人类直觉虽重要,但其中许多判断可被客观指标标准化,从而被AI学习与复现。真正的突破不在于AI是否能独立“发明药物”,而在于它能否系统性加速从靶点到候选分子的整个路径。这种流程级效率提升,将在未来几年产生深远影响。

作者:Ash Jogalekar. 2025-10-31. Night Thoughts on the Promise of Agentic AI in Drug Discovery. Available at: https://www.linkedin.com/pulse/night-thoughts-promise-agentic-ai-drug-discovery-ash-jogalekar-p0dgc
编译:肖高铿
AI与药物发现的问题(除了普遍存在的炒作之外)在于,它过于聚焦于“产品”本身——总在谈论我们如何获得新药,或如何改进现有药物。这些当然都很好,或许终有一天会实现。但这类话题之所以吸引眼球、登上新闻,是因为它们听起来炫酷。而同等甚至更为重要的是“过程”——即发现药物的路径。任何从事过药物研发的人都知道,这条路径包含无数个步骤。
如今,“代理型AI”(agentic AI)成了充斥着各种流行语的科技世界中的又一个热词。但其核心其实包含两个原则上简单(尽管实现起来复杂)的要素:自动化与推理。目前,自动化部分正变得越来越真实,而我认为我们已经开始触及推理能力的门槛。
我之所以认为代理型AI在药物发现中潜力巨大,是因为它有望彻底革新药物研发的流程,并大幅提升通向最终产品的速度与效率。我的这一观点部分源于亲身经历——虽然并非直接部署代理型AI,但我处理过一些问题,而我确信代理型AI能在这些问题上提供巨大帮助。下面举两个例子。
几个月前,我需要对20多个癌症靶点进行靶点分析。这数量相当庞大,因为每个靶点都需要多层面的研究:需评估其临床验证情况、竞争格局、现有药物及其缺陷,还需考察可用于该靶点药物开发的化学物质或生物结构等。这类任务典型地耗时耗力,通常需要数周甚至数月——你需要深入挖掘大量文献、综述、专利、公司报告、临床试验数据、新闻稿等资料。幸运的是,借助大语言模型(LLMs),我将原本可能需要两三个月(甚至更久)的工作压缩到了约六周内完成。当然,我仍需验证每一步结果,而这几乎占用了我大部分时间。LLMs时常会弄错PDB编号、化学物质或文献信息,但错误并不至于难以处理,相比传统方式已是质的飞跃。
另一个例子是工作流自动化。在药物发现的分子建模中,通常有一套标准操作流程:比如你有一个分子数据库,先进行清洗,再生成构象,然后可能将这些分子对接到某个蛋白上,或在其他数据库中搜索类似类似物,最后进行后处理分析。对接完成后,你会依据某些指标或参数筛选出最佳结果,并基于这些结果进行若干轮迭代优化。中间当然还有重要的实验环节(此处暂不展开),但代理型AI同样能发挥作用——它可根据类似项目判断缺失环节,并有效整合实验数据。
我曾利用Claude和ChatGPT编写了一个Python脚本,只需输入一个配体和一个蛋白作为参数,即可自动完成以下任务:从ChEMBL数据库(通过其REST API)中检索该分子的类似物,将这些类似物对接到目标蛋白,筛选出前5–10个最优类似物(依据氢键质量、分子张力等指标进行排序),再对这些高排名类似物进一步搜索其类似物、重新对接,并对最终前10名进行分子动力学(MD)模拟以评估结合构象的稳定性。这种可称为“部分AI代理”的系统,至少能完成一个包含多步骤的典型设计循环,尽管尚未具备复杂的决策能力。整个脚本搭建仅耗时约一小时,调试时遇到的问题更多是简单的文件格式问题(始终牢记莫拉维克定律:“对计算机而言,难的事容易,容易的事反而难。” LLMs常在简单问题上犯低级错误,却能正确处理更复杂的任务)。
这还只是初步的线性流程。你可以想象在此基础上增加层级、复杂度,引入分支和决策点。可以把核心流程看作一个枢纽,周围延伸出多条可扩展的“辐条”。例如,你可能希望检索专利或文献中是否存在类似分子,并据此优化结果;你可能希望整合其他AI模型的数据,运行互补类型的模型并将结果纳入分析;也可以并行运行基于物理的模型并整合其输出;你还可以——尤其在评估脱靶效应时——考察相似蛋白,并预测你的分子与这些蛋白的相互作用,从而预判化合物潜在风险。此外,还可加入理化性质范围或可购买性约束(通过接入化学供应商数据库)来进一步优化候选分子排序。所有这些最终将汇聚成一个“超级脚本”或“超级代理”,统筹协调整个流程。任何科学家都能轻易估算:若能实现上述自动化,将节省多少宝贵时间。
当然,人们(尤其是药物发现领域的科学家、化学家和生物学家)对此类流程常提出一些合理质疑,核心通常归结为两点:推理能力和人类干预。药物化学家或生物学家往往会指出,在每个流程末端都存在关键的人工干预节点——你需要审视结果、可视化分子对接构象,靠在椅背上仔细观察,再凭借专业判断和经验决定下一步。这并非计算机所擅长,我完全同意。事实上,我职业生涯中最有成效的药物设计时光,往往是在白板前与药物化学家、计算化学家和生物学家进行两三个小时的头脑风暴——我们结合客观指标与更模糊的直觉和经验,共同决定下一步合成哪些化合物。有时,老一辈科学家甚至会凭直觉建议合成某个分子,却说不清具体原因。
但对此有两点回应。首先,没人主张完全取消人类干预。我从不认为AI能取代专家——我们永远需要专家。因此,在代理型AI工作流的关键决策点,人类必须介入审查结果。可以把这些AI代理视为助手,或被委派任务的下属。就像在组织中,你授权下属负责项目,但他们完成后仍需向你汇报,由你审核结果是否合理。这一过程的重要性毋庸置疑,代理型AI工作流同样需要在明确定义的节点嵌入“人在环路”(human-in-the-loop)。药物发现领域的从业者清楚这些关键节点在哪里。
以分子对接结果为例:专家会审视对接得到的结合模式,并解释为何偏好某些结果。我们始终保留人工审核的选项,而理想情况下,AI代理的核心价值在于提升供人类审查结果的信噪比与质量。这正是药物发现技术长期以来的承诺:提升结果质量、缩小候选范围,从而缩短决策时间并降低失败概率。技术并非取代人类干预,而是减少干预频次并加速决策。
其次,尽管人类的推理和可视化判断具有主观性和直觉性,但这并非“魔法”。人们常提到“手工匠式”药物发现,这确实存在——资深从业者能迅速凭直觉判断蛋白-配体复合物结构的质量、优缺点及可优化之处。我的导师Jim Snyder就具备超凡的立体与电子效应视觉感知能力。但这仍非魔法。很多时候,即使人类专家审视计算结果,也是依据一套相对客观的标准指标来判断结果的可靠性。回到对接例子:他们会评估氢键质量,检查模型是否存在不合理之处(例如配体极性基团伸入疏水口袋通常不是好现象),观察是否有过多柔性链暴露在溶剂中(导致分子过于“松软”),因为分子柔性越大,对接准确性越低,此时才需引入专家判断。此外,当他们提到“依靠经验”时,通常是指回想曾处理过的类似配体。而“相似性”本身是可以客观定义的——项目中看到一个分子,常会联想到其他项目(有时针对相似靶点)中的类似分子。相似靶点和相似分子均可通过检索获得。
我想强调的是:人类干预虽特殊,但并不神秘。其中某些部分将始终独特,但另一些部分则可被客观量化、复现并标准化。我们所谓的“直觉”,至少部分建立在人们用于评估对接构象或分子动力学结果可靠性的客观标准之上。因此,只要教会AI代理关注哪些要素,这些任务均可由其完成。再次强调,目标并非直接“吐出”一个药物——我们的任务是缩小高质量候选化合物、高质量结果、需合成的分子、需表达的蛋白或需开展的实验的范围。
另一个更直接的普遍质疑是:如果产出结果本身不准确或不确定,加速流程又有何意义?确实,无论是AI还是基于物理的模拟方法,现有建模协议都不完美,结果常混杂大量假阳性和假阴性。但此时需牢记药物发现的基本信条:“尽早失败,快速失败”。在时间紧迫、数据永远不足、每日烧钱如流水的行业中,“尽早失败”的重要性再怎么强调也不为过——尤其对仅有1–2年资金跑道的初创公司而言,快速失败至关重要。我认为,代理型AI通过批量处理标准化任务,可帮助科学家迅速排除或优先排序结果。在这个“时间就是金钱”的行业,快速失败已是优势,而“极速失败”更佳——这正是代理型AI所能赋能的。
正因如此,我坚信:或许在短短一两年内,最多五年,我们将见证药物发现流程的效率发生质的飞跃。至于这会催生多少新先导化合物、临床候选药物或上市新药,无人能准确预测——这类预测本就徒劳。但流程本身将变得显著高效、显著加速。这正是我对代理型AI在药物发现中潜力感到兴奋的原因。
我常想起一句常被归于比尔·盖茨的名言:“人们往往高估一项技术的短期价值,而低估其长期价值。” 对AI的高估在于它承诺“发现新药”;而对其价值的低估,则在于它正在切实地让药物发现过程变得更快速、更自动化。我认为,这一方面将在未来几年产生累积性的巨大影响。