FLARE FEP算例 | 炼金术法FEP预测FXR激动剂的结合自由能

摘要：本文以D3R CG2的Free Energy Set 2数据集的14个IC₅₀跨度为1000倍的FXR激动剂为例，分析了Flare/FEP预测结合亲和力的性能。结果表明，预测值与实验值具有极其显著的相关性：Kendall Tau=0.64, Pearson R=0.90； MUE=0.35；RMSD=0.35。预测值可以显而易见地将高活性化合物与低活性化合物区分为两类。此外，借助云计算资源，整个计算可以在1个小时左右完成。这说明，借助云计算取之不尽的资源，FEP可以帮助药化/计算团队快速、可靠地对结构相似的同系物进行排序，从而加速项目的进度。

肖高铿/2020-07-27

背景

在药物研发过程中，常需对活性分子的特定片段或整体骨架进行结构修饰，以改善其药理学特性（如活性、选择性、ADME性质）或拓展至新颖的化学空间。在苗头化合物（hit）或先导化合物（lead）优化阶段，药物化学研究人员通常借助经典生物等排体替换策略，或利用如SPARK等计算工具，高效生成一系列侧链或骨架替换的候选分子。然而，面对众多结构变体，如何优先选择合成目标成为关键挑战。本文以D3R Grand Challenge 2（GC2）中一组活性差异达三个数量级（IC50 跨越约1000倍）的Farnesoid X受体（FXR）激动剂同系物为模型体系，演示如何利用FLARE FEP方法对候选分子进行高精度排序，以辅助药物化学决策。

FXR激动剂算例介绍

非酒精性脂肪性肝炎（NASH）是一种尚未被充分满足临床需求的疾病，FXR作为其关键治疗靶点，备受关注。D3R Grand Challenge 2（2016–2017）第二阶段的Free Energy Set 2数据集^[1]包含18个结构高度相似的FXR激动剂同系物，共享同一母核骨架，但IC₅₀值跨越近三个数量级（约28 nM至41,800 nM），是验证相对结合自由能预测方法的理想基准数据集。D3R GC2采用Kendall’s tau相关系数与中心化均方根误差（RMSEc，单位：kcal/mol）作为主要评价指标。

Schindler等人^[2]采用Schrödinger FEP+对这18个化合物进行了相对结合自由能预测。从净电荷分析，其中14个化合物为羧酸根形式（带一个负电荷），其余4个为中性分子。为满足FEP方法对体系电荷一致性的要求，作者在对接过程中将羧基统一处理为中性。计算结果如图1所示，FEP+预测值与实验ΔG具有良好的排序能力：Kendall’s tau = 0.50 ± 0.12，Pearson相关系数R² = 0.80 ± 0.08，RMSE = 1.31 kcal/mol。相比之下，Prime MM-GBSA方法的性能显著较差（R² = 0.72 ± 0.11，RMSE = 9.31 kcal/mol）。值得注意的是，即使仅针对14个带电羧酸分子进行FEP+分析，RMSE也仅微降至1.21 kcal/mol，表明电荷一致性处理对整体性能影响有限。

图1. Schindler等人对18个FXR激动剂的ΔG预测结果

数据准备

用Flare下载FXR_12与FXR的复合物结构(PDB 5Q0W)，并在默认条件下（pH=7.0）准备蛋白结构，并将配体FXR_12从蛋白中提取分离。其它的化合物以FXR_12为模板，在结合位点里用Flare的结构编辑器直接修改、能量最小化后保存。

鉴于FEP方法不能同时处理不同电荷的分子，本文仅以D3R CG2的Free Energy Set 2数据集中的FXR激动剂的14个带负电荷的羧酸分子（见Table 1）为研究对象，考察FLARE/FEP的预测性能。

准备好的蛋白结构：5Q0W_protein.pdb

准备好的配体结构(带FEP预测结果)：fxr-agonist.sdf

准备好用于FEP计算的Flare项目文件(已经包含一个计算结果)：D3R-FXR-FEP.flr

Table 1. 14个FXR激动剂的结构、IC₅₀（nM）及其预测的ΔG (kcal/mol)

Structure	ID	IC₅₀(nM)	ΔG(Exp)	ΔG(Pred)
	FXR_10	5640	-7.2	-7.1
	FXR_12	58	-9.9	-8.5
	FXR_74	655	-8.4	-9.2
	FXR_76	41800	-6.0	-6.3
	FXR_77	250	-9.0	-9.0
	FXR_78	28.3	-10.3	-10.5
	FXR_79	4150	-7.3	-7.4
	FXR_81	2690	-7.6	-8.0
	FXR_82	180	-9.2	-8.8
	FXR_83	330	-8.8	-8.9
	FXR_84	4540	-7.3	-7.5
	FXR_85	297	-8.9	-8.5
	FXR_88	540	-8.6	-8.9
	FXR_89	735	-8.4	-8.1

FEP计算

详细的操作流程请参见：云计算教程 | 用FLARE FEP计算相对结合自由能^[3]。这里仅对关键的参数进行描述，如果没有说明则为默认参数。

图的生成

FLARE的FEP计算支持两种类型的图：normal与Star图。Normal图模式精度高,也更耗计算资源；Star图适合于研究结构与活性关系研究，但精度有所损失。本文采用以FXR_12为中心的Star图模式（见Figure 2)。实际上，FXR_16比FXR_12更适合做为Star图的中心分子，因为FXR_16与磺酰基连接的末端芳环为苯环，更加容易转化为其它取代苯环或噻唑环，也就更容易计算成功。

Figure 2. 以FXR_12为中心的星型、单向网络

由于涉及到的14个分子IC₅₀已知，本计算实验的主要目的时考察预测值与实验值的关系，因此生成图的时候采用了Benchmark模式，而不是Product模式。

FEP计算参数

FEP计算时小分子力场采用AMBER/GAFF2，并分配AM1-BCC电荷；体系设置10Å的溶剂盒子；每个体系进行了4 ns的分子动力学模拟；Figure 2中每对分子之间的link采用单向模式（quick mode）：每个方向上仅计算从小分子\(→\)大分子的转化，每个方向默认计算9个λ窗口。鉴于FXR_12\(→\)FXR_79有较大的结构变化，因此设置15个λ窗口;FXR_12\(→\)FXR_85也设置了15个λ窗口。

硬件资源：云计算加速FEP计算

如Figure 2所示，共有13个Link，总共有111(9*9+2*15)个λ窗口需要计算，因此至少可以使用111个GPU进行加速计算。在本实验中，采用深圳云端软件公司(Cloudam)的云E算力平台的计算资源进行计算，broker设置最大使用200张GPU，每节点1张Tesla T4卡+4个CPU核心+8GB的内存。

具体的云计算资源使用方法见：云计算教程 | 用FLARE FEP计算相对结合自由能^[3]

结果

关于预测性能

ΔG的实验值与预测值见Table 1, Kendall τ与Pearson R相关性系数分别为0.64（p-value=0.001）与0.90（p-value=0.0000145），这表明实验值与预测值之间具有极其显著的相关性；MUE为0.35；RMSD为0.50，比Schindler等人^[2]报道的FEP+预测结果RMSD=1.31要低0.8，具有更好的精密度。

Figure 3. 结合自由能ΔG的实验值与预测值比较

根据Figure 3的ΔG实验值与预测值散点图可以直观地将结合亲和力高、低的化合物聚类区分开：ΔG大于-8.0与小于-8.0的化合物被明显地区分。尤其是IC₅₀大于1000nM的化合物都被被归属于ΔG大的化合物，而IC₅₀最低的几个化合物都聚集在ΔG预测值最小的化合物里。这说明使用Flare/FEP可以帮助药化工作人员可靠地做出化合物排序决策。

更重要的是，几个不同的生物等排体得到很好的排序，尤其是卤素取代苯环的衍生物的排序：1）苯环被噻吩取代对活性不利；2）苯环的氟取代对活性不利；苯环的氯、溴取代对活性有利。这是药物化学研究阶段非常重要的信息，而Flare/FEP可以准确在实验前的告诉你。FEP似乎对低活性化合物识别的特别好：预测为活性最差的5个化合物，确实也对应为IC₅₀最高的5个化合物；在预测活性最高的5个化合物里，包含了实际活性最强的化合物FXR_78。

与不用FEP的方法比较：logP、分子量与打分函数

用Flare计算的SlogP与分子量通常做为空模型，分析SlogP、分子量与实验结合自由能(pIC50)的关系；同时，也用Ligandscout的Binding Affinity Score来预测结合亲和力，分析预测值与实验结合自由能(pIC50)的关系。好的FEP方法，应该要优于空模型与打分函数。结果表明，SlogP、分子量、结合亲和力打分值与pIC50具有强相关性，Pearson相关性系数分别为0.717、0.644与-0.701,远低于Flare FEP的0.9，这说明使用更贵的FEP计算是有价值的，更多的统计学指标见表2。

表2. 结合自由能（pIC50）与logP、分子量、打分函数相关性分析的统计学结果

Iterms	SlogP	MW	Binding Affinity Score
Pearson Correlation (r)	0.717	0.644	-0.701
Spearman Rank Correlation(ρ)	0.713	0.626	-0.7
Root Mean Squared Deviation (RMSD)	1.07	589.438	54.99

与pyAutoFEP比较

在2021年的时候，Carvalho等人发表了自动相对结合自由能计算工作流pyAutoFEP^[4]，刚好与本文采用了同样的测试集，除了化合物FXR_10之外。在pyAutoFEP测试中，使用AMBER03/GAFF/AM1-BCC without REST2时性能表现最佳：Pearson Correlation r=0.71；RMSE=1.07 kcal/mol。这个预测精度与不用模型的SlogP差不多，这说明了：在这个例子里，使用pyAutoFEP没有比空模型SlogP更好，也就是用了pyAutoFEP没有比不用更好。

关于机时与费用

本实验在Cloudam上计算完成，Cloudam提供了多种GPU型号可供选择，本次计算实验采用价格最低的Tesla T4进行计算。峰值时Flare调用120多张卡，全部计算实验大约在1.15小时内完成，总共机时费大约600元。这说明，此类FEP计算可以在非常合理地时间内完成，为计算和药化团队提供快速、可靠的结果对化合物进行排序与决策。云计算近乎取之不尽的资源为高精度的FEP计算提供了算力保障，真正地加速了项目研发进度。同时，在本计算中，每个化合物的平均计算费用约为42元，略低于之前^[3]预计的费用。

文献

D3R GC2. Drug Design Data Resource. https://drugdesigndata.org/about/grand-challenge-2
Schindler, C.; Rippmann, F.; Kuhn, D. Relative Binding Affinity Prediction of Farnesoid X Receptor in the D3R Grand Challenge 2 Using FEP+. J. Comput. Aided. Mol. Des. 2018, 32 (1), 265–272. https://doi.org/10.1007/s10822-017-0064-z.
肖高铿,李青松. 云计算教程 | 用FLARE FEP计算相对结合自由能. http://blog.molcalx.com.cn/2020/07/17/flare-fep.html
Carvalho Martins, L.; Cino, E. A.; Ferreira, R. S. PyAutoFEP: An Automated Free Energy Perturbation Workflow for GROMACS Integrating Enhanced Sampling Methods. J. Chem. Theory Comput. 2021, acs.jctc.1c00194. https://doi.org/10.1021/acs.jctc.1c00194.

联系我们

我们不仅提供软件，还提供云计算资源与FEP计算服务。

FLARE FEP算例 | 炼金术法FEP预测FXR激动剂的结合自由能

背景

FXR激动剂算例介绍

数据准备

FEP计算