摘要:本文介绍了Cresset自由能微扰计算解决方案Flare FEP让自由能计算使用平民化的产品设计理念以及为实现这一理念相关的独特技术特征,包括准备感兴趣的分子体系、溶剂采样、运行FEP计算、进行故障排除、多种分析结果分析工具、自适应λ调度、中间体的自动生成和自定义力场参数。还回顾两个算例,演示了如何与Hit Expander以及Spark等工具协同工作,实现快速先导化合物发现与优化。

原文:Sofia Bariami.2023-11-06. https://www.cresset-group.com/about/news/accurate-efficient-and-easy-to-run-fep
编译:肖高铿
前言
计算化学是一个充满发展变化的领域,其特点是每年都有大量新增的工具。自由能微扰(Free Energy Perturbation ,FEP)计算因为有助于研究人员准确预测分子的结合亲和力、为新药的设计和优先性排序做出重大贡献,已成为这一武器库的重要组成部分。在Cresset,我们认识到FEP的巨大潜力,开发了Flare™ FEP——一种功能强大、创新的解决方案,旨在使FEP计算准确、高效且易于运行。我们的愿景不仅仅是发布一款产品,我们的目标是使FEP的使用平民化、不是少数人的特权,而是所有人都可以使用的标准方法。有了Flare FEP,我们设想在未来,任何人,无论其技术背景如何,都可以利用自由能计算的力量,将其应用于各种项目,以释放新的可能性,制造出重要的分子。
Flare FEP的创新功能在设计时就考虑到了这种可及性。这个思想贯穿了从项目开始到结束时的各个阶段以简化FEP计算,并包括准备感兴趣的分子体系、运行FEP计算并对其进行故障排除、分析结果并决定下一步行动的工具。自适应lambda调度、中间体的自动生成和自定义参数推导只是其中的几个例子,它们允许任何人,无论其专业水平如何,都可以将FEP计算的能力引入到他们的项目中。本文将详细地探讨Flare FEP的这些功能特性。
建立和运行Flare FEP实验:实现精度和计算效率之间的平衡
为了让您更好地了解Flare FEP的独特技术特征,让我们假设我们想使用一组已知实验活性的同系物配体进行一次短的FEP计算。用户在打开Flare项目时首先会注意到的是其用户友好的界面,这是所有Cresset软件解决方案所共有的元素。Flare的设计在技术成熟度和可用性之间取得了平衡。在Flare中导入感兴趣的蛋白质以及配体并进行准备,使用我们专有的配体叠合方法将配体叠合到与靶标共结晶的配体上,以快速生成FEP计算的良好起点。几分钟内,将用于FEP计算的体系准备就绪。
下一步涉及生成FEP图,该图连接同系物分子以定义炼金术转化。通过LOMAP自动微扰图生成、预测中间体并将其纳入FEP图的能力增强了Flare FEP的可用性和用户友好性1。在转换过于复杂而无法一步完成的情况下,软件会智能识别这些情况,并将中间体分子插入到FEP图。这不仅提高了模拟的准确性,而且平滑了从初始状态到最终状态的路径,确保了转换在计算上是可行的。在智能使用LOMAP的指导下,这种自动化水平最大限度地减少了用户干预,确保了更精简、高效和准确的FEP模拟。上述启动FEP实验的步骤可以在几分钟内完成,如图1所示。

图1.基于最大公共子结构(MCS)的配体叠合。该工作流程从蛋白质的晶体结构和一组配体开始,导入到FEP项目并创建FEP图可以在几分钟内完成。
生成FEP图后,需要运行计算本身。每个转化都由许多独立的分子动力学(MD)模拟组成,这些模拟发生在λ坐标上,确保不同状态之间的平稳过渡。运行MD模拟意味着配体和蛋白质应该用力场进行参数化:Flare为小分子的参数化提供了Amber和OpenFF力场2-4。后者允许推导小分子扭转角的自定义力场参数,Flare FEP利用这一能力来提供高度准确的结果。通过允许定制高质量的扭转角参数,该软件可以满足每个配体独特的结构和动力学特性。这种方法可以提高模拟的精度,并确保更准确地表示分子的行为。因此,用户能够依赖于为其特定配体量身定制的更精细的力场模型,从而显著提高了他们在某些体系上FEP计算的准确性。
预测的自由能的质量取决于结合口袋内事件的有效采样。因此,准确建模溶剂效应至关重要。适当的采样可以评估溶剂的贡献,包括去溶剂化和重组,这会对自由能计算产生重大影响。先进的采样技术对于准确的预测通常是必要的,出于这个原因,Flare FEP配备了大正则非平衡候选蒙特卡罗(Grand Canonical Non Balancement Candidate Monte Carlo, GCNCMC)方法,该方法通过在结合位点配体周围的球体内插入和删除水分子来重新产生水合结合位点(图2)5。与使用Metropolis接受标准的标准大正则蒙特卡罗(Grand Canonical Monte Carlo,GCMC)方法不同,非平衡候选采样技术提高了插入/删除水的成功概率,使算法更加高效。

图2. GCNCMC在配体周围的球体中插入和删除水分子,高效地捕捉结合位点的溶剂化效应。球体的半径可以由用户定义。
Flare FEP的一个突出特点是“自适应lambda(λ)窗口算法”,该算法显著提高了速度并降低了计算成本,如图3所示。传统上,配体转换的λ值的选择是静态的,并且往往是任意的,在某些情况下导致采样效率低下,从而导致结果不准确。相反,Flare FEP独特的自适应λ窗口算法在游离相中(在溶剂中的配体)运行非常短的MD计算,并在实际FEP计算之前计算λ态帧之间的重叠,从而确定确保FEP计算收敛所需的最佳λ窗口数。这种自适应特性完美地平衡了精度和计算效率。Flare FEP的自适应方法确保只使用所需的最小窗口,而不是使用固定的、可能过多的λ窗口(这可能导致不必要的模拟和成本增加)。这有效地优化了FEP计算的时间和成本。因此,可以在更短的时间内以降低的成本获得可靠的结果。

图3.自适应λ算法确保每次变换使用最小数量的λ窗口,在不影响计算精度的情况下将计算成本保持在最低。
GPU加速技术进一步提高了Flare FEP的可用性,该技术使得FEP计算可运行于从最新技术到消费级图形处理单元(GPU)等各种硬件配置。这种能力使研究人员能够使用易于获得且具有成本效益的硬件来完成复杂的计算化学任务。Cresset Engine Broker™是一种可以将将客户端计算机(运行在Windows、Linux或macOS上)与Linux集群等高性能计算资源连接起来的应用程序,在Cresset Engine Broker的加持下研究人员可以利用GPU的强大算力进行FEP计算。这一因素使其成为在预算紧张但仍在寻求顶级软件的计算化学团队的一个有吸引力的选择。此外,对于那些需要大量计算资源或寻求基于云计算解决方案的人,Flare FEP还支持通过AWS运行计算。这种硬件和云选项的灵活性提供了一个适于包容各种计算需求的平台,突显了Flare FEP对以用户为中心的设计和功能的承诺。
评估FEP实验的准确性:简单的结果分析
回到我们的例子,一旦基准FEP计算完成,我们就可以开始分析结果来验证模型。然而,与所有计算方法一样,FEP计算也并非没有潜在的陷阱和误差源。在软件中集成一系列故障排除工具有几个优点。
运行计算后使用的第一个工具是“活性图”(图4,右),它显示了实验活性值与预测活性值的对比,因此用户可以使用R2和平均无符号误差(MUE)等统计数据来评估模型的准确性。在Flare FEP中,活性图配备了“子图分析”(图4,左),这一功能有助于识别内部误差统计较低的分子子集(如果有的话)。

图4.活性图和子图分析是Flare FEP的两个工具,可以帮助您评估FEP实验的准确性。
当涉及到采样和收敛问题时,Flare FEP提供了一系列工具,有助于识别可能的问题。“链路图(Link plot)”(图5,左)显示了使用热力学积分(TI)和多状态Bennett接受比(MBAR)等技术计算自由能差(ΔG),以及每个λ窗口的贡献,在识别自由能计算期间的采样问题方面发挥着至关重要的作用。通过比较TI和MBAR的结果,我们可以深入了解FEP计算的一致性和收敛性。检查每个λ窗口的贡献会突出显示模拟中采样可能不足或有问题的区域。TI和MBAR结果之间的差异或贡献中的异常模式可能预示着采样不足、滞后或构象转变缓慢等问题。
闭环误差(Cycle error)和滞后分析(hysteresis analysis)提供了一种发现计算中不一致和潜在误差的方法。“闭环误差”(图5,中)可以揭示从直接路径获得的自由能与从反向路径获得的自由能差异。另一方面,滞后现象表明系统是否尚未达到平衡,这可能导致自由能计算不准确。
绘制转化的“重叠矩阵(overlap matrices)”(图5,右)对于评估模拟中相邻状态之间的采样质量也至关重要,因为较差的重叠可能导致不可靠的自由能差。Flare FEP提供的工具可以直观地突出重叠较差的区域,并帮助研究人员在优化模拟参数方面做出更明智的决定(例如,更改特定链接的选项)。

图5.链路图(link plot)、闭环误差(cycle errors)和重叠矩阵(overlap matrix)使我们能够确定可能导致计算不一致的采样问题。
可视化是分子模拟的关键。Flare FEP中的“3D视窗”允许用户检查转化过的配体构象,并确保配体在模拟过程中不会采用任何不切实际或不希望的几何形状,这可能会使结果产生偏差。配体的3D结构显示为向前和向后变换开始时(λ=0)和变换结束时(λ=1)轨迹最终帧的快照。3D窗口还配备了Flare中可用的工具,例如分子表面的可视化,如图6(左)所示。此外,FEP图(图6,右)不仅显示了配体的转化,而且还提供了计算相关的有用信息。结合亲和力实验值(如果有的话)和计算值显示在配体2D图下方。自由能的相对差异(ΔΔG)显示在链路上方,链路也进行了颜色编码,以突出任何滞后现象。

图6. Flare FEP中的可视化工具允许在3D视窗中检查分子的起始和最终状态,以及通过FEP图检查转换。
集成的工作流程简化了苗头到先导的优化过程
Flare FEP的可用性不仅限于用于运行基准FEP实验的功能,还提供了一些工具,通过将Flare FEP与其他工具和产品(如Hit Expander或SparkTM)相结合的集成工作流,简化并加速生成新设计思想的过程。
Hit Expander的优势在于它能够通过取代分子结构中的原子,毫不费力地产生许多简单的分子变体。可以选择取代的具体位置,然后在每个合适的位置插入原子或R基团,在几秒钟内产生新的设计。
Spark是Cresset的生物等排体替换和骨架跃迁工具,可以快速探索多样的化学空间。通过提出特定分子片段的替换,Spark使得研究人员能够创造性地思考化学结构修饰。该工具利用来自真实分子潜在生物等排体替换片段的庞大数据库,提出保持或增强所需生物活性的替代物。
Hit Expander和Spark都可以无缝集成到Flare FEP工作流中,旨在产生具有改进的药理学特性的新分子。通过Flare FEP中的“Quick FEP”选项,可以将Hit Expander和Spark产生的新设计提升到一个新的水平。该功能让用户能够对设计的分子进行快速的FEP计算,定量评估结构修饰对结合亲和力或其他相关性质的潜在影响。通过这样做,我们可以高效地对最有希望的候选化合物进行分级审查与优先级排序以便进行进一步的研究。
案例:快速、准确的苗头到先导过程用于CDK9抑制剂的发现
最近的一些案例研究举例说明了在Flare FEP中这些集成工作流的潜力。在第一个案例研究中,我们的目的是评估计算机工作流是否有助于发现活性CDK9(一种癌症研究的关键靶标)抑制剂。首先,我们结合Quick FEP进行了Hit Expander实验。在这个过程中,我们获得了高活性分子,并提出了进一步修饰以提高活性的合理建议。通过Hit Expander的快速计算筛选过程,探索了特定分子周围的SAR景观,并产生了84个新的配体。然后使用“最小生成树”图,用“Quick FEP”对这些分子进行分类。然后对这些分子中最佳的20%分子用标准的、多连接图进行第二次FEP实验进行精细筛选,并鉴定出了几个对CDK9靶标具有显著结合亲和力、有前景的候选化合物。值得一提的是,从构思到识别潜在候选药物的整个过程在不到24 GPU小时内完成。
案例:SARS-Cov-2 Mpro半胱氨酸蛋白酶潜在抑制剂的结合自由能计算和生物等排体替换研究
第二个案例研究证明了Flare FEP计算与Spark结合使用时在指导化学修饰策略以提高对SARS-Cov-2 Mpro半胱氨酸蛋白酶的活性和选择性方面的有效性。基准测试研究表明,在先前研究中确认的一组抑制剂的结合亲和力实验值和预测值之间具有线性相关性(R2=0.55,MUE=0.58 kcal/mol)。用Spark产生了新的分子设计,并用Flare FEP对其进行了评估。值得注意的是,在Spark的设计中,至少有13个分子表现出等于或大于原始化合物的活性。

图7. 将Spark产生的新分子设计导入Flare,并叠合到共晶配体上以开始FEP实验。
这些将Flare FEP与其他软件解决方案和模块相结合的协作方法,为设计和评估新分子提供了强大的工具包。Hit Expander和Spark,再加上Flare FEP的速度和准确性,不仅有望加速新药的发现,而且还使研究人员能够探索化学空间的未知领域。
为什么选择Flare FEP?功能齐全但价格合理的解决方案!
探索了Flare FEP的独特技术特征,并看到了其可用性的两个例子,很明显,Cresset的解决方案在这一竞争格局中脱颖而出。最终,技术特征转化为更快、更准确的结果,并大幅节省成本。随着我们引入新的功能和方法,Flare FEP继续表现出显著的性能增强。这一点在下面的图表中得到了直观的体现,图8展示了我们的软件与以前版本(各种蓝色)和Wang等人6的结果(紫色)的准确性比较。图表中的最后一组条形图提供了对所研究的所有分子体系的平均评估。可以看出,所获得的平均R2值超过了我们之前版本的性能,MUE比Flare的早期版本迭代低约0.10 kcal/mol。值得注意的是,在这些特定分子体系上, Flare FEP的准确性与Wang等人6报道的准确性相当。

图8. 最近三个Flare版本与Wang等人6报道的原始计算之间的MUE和R2比较
然而,Flare FEP之所以吸引用户,不仅是因为它的功能,而且还因为它的价格实惠。虽然市场上有其他FEP工具,但往往价格高昂,这让许多研究机构和学术机构望而却步,Flare FEP提供了非常有竞争力的价格。
总之,Flare FEP为计算化学中的自由能计算带来了一种创新的方法。它的技术能力,加上用户友好的界面,将重新定义计算化学家如何处理他们的工作,提供一种不仅高效而且具有成本效益的工具。无论您是一位训练有素的计算化学家,还是一位仍在计算化学软件世界中摸索的学生,Flare FEP都提供了一个全面、直观、强大的工具,可以帮助简化您的工作流程并提高您的研究成果。我们的信息是明确而不妥协的:FEP不应该是一种特权,而是一种标准!
做出正确的配体设计选择,并满怀信心地实现潜在先导化合物优化——立即申请免费测试并在您的项目中尝试Flare FEP。在评估过程中,您将有机会对Flare FEP的全方位独特功能进行测试,同时可以自由发布任何产生的结果,并将其用于进一步研究。
参考文献
- S. Liu, Y. Wu, T. Lin, R. Abel, J. P. Redmann, C. M. Summa, V. R. Jaber, N. M. Lim, D. L. Mobley, Lead optimization mapper: automating free energy calculations for lead optimization, J. Comput. Aided Mol. Des., 2013, 27, 9, 755-770
- J. A. Maier, C. Martinzes, K. Kasavajhala, L. Wickstrom, K. E. Hauser, C. Simmerling, ff14SB: Improving the Accuracy of Protein Side Chain and Backbone Parameters from ff99SB, J. Chem. Theory Comput., 2015, 11, 8, 3696-3713
- J. Wang, R. M. Wolf, J. W. Caldwell, P. A. Kollman, D. A. Case, Development and testing of a general amber force field, J. Comput. Chem., 2004, 25, 9, 1157-1174
- https://openforcefield.org/force-fields/force-fields/
- M. L. Samways, H. E. Bruce Macdonald, J. W. Essex, grand: A Python Module for Grand Canonical Water Sampling in OpenMM, J. Chem. Inf. Model., 2020, 60, 10, 4436-4441
- L. Wang, Y. Wu, Y. Deng, B. Kim, L. Pierce, G. Krilov, D. Lupyan, S. Robinson, M. K. Dahlgren, J. Greenwood, D. L. Romero, C. Masse, J. L. Knight, T. Steinbrecher, T. Beuming, W. Damm, E. Harder, W. Sherman, M. Brewer, R. Wester, M. Murcko, L. Frye, R. Farid, T. Lin, D. L. Mobley, W. L. Jorgensen, B. J. Berne, R. A. Friesner, R. Abel, Accurate and Reliable Prediction of Relative Ligand Binding Potency in Prospective Drug Discovery by Way of a Modern Free-Energy Calculation Protocol and Force Field, J. Am. Chem. Soc. 2015, 137, 2695−2703
获取试用、商务合作,请联系我们
立即申请免费的Flare试用版,开始用Flare FEP来分析您自己的项目!此外,我们还提供FTE技术服务,由我们的专家帮您完成计算任务。