摘要:已经有大量的算例表明,Flare FEP可以可靠地预测化合物的结合亲和力。本文演示了如何借助Cloudam云E算力平台j加速FLARE FEP相对结合自由能计算,包括:1)Cloudam账号注册;2)Cloudam的使用;3)云端软件安装;4)在云端启用Broker;5)客户端计算资源的配置;6)FEP项目的创建;7)FEP生成图;8)FEP计算。借助云计算资源,Flare FEP可以在2-4小时内完成一个项目的计算。

作者: 肖高铿,李青松
日期:2020/07/17

Flare FEP: GPU加速的自由能微扰

FEP简介

自由能微扰(Free Energy Perturbation,FEP)计算可用来预测同系物的相对结合亲和力变化。 在FEP计算中,分子通过非物理(“炼金术”)途径逐渐转变为结构上密切相关的类似物。通过对这些互相转化的终态之间的自由能差(ΔΔG)的计算评估,可以获得与实验值相比约1kcal/mol的预测精度。

Flare内置了FEP计算工作流,支持GPU加速计算。它将AMBER Tools,OpenMM,LOMAP,Sire和BioSimSpace等开源工具与Cresset专业、直观特性相结合,为完全自动化的FEP工作流程提供了用户友好的界面(图1)。

Flare FEP

Figure 1. Flare全自动的FEP工作流

Flare中的FEP工作流已用多种数据集完成验证[1],包括FEP+数据集作为参考基准,部分结果如表1所示。结果表明,FLARE/FEP预测性能与Schrodinger/FEP+(Wang et al.[2])相当,而大大地优于AMBER的GPU-TI(Song et al.[2])。通过Flare图形用户界面和Flare Python API,可以完全控制模拟参数,使您能够探索和设定给定配体集合及其靶蛋白的理想条件。

Table 1. FEP基准数据测试结果

Data Set Flare V3/UoE Wang et al. Song et al.
R MUE R MUE R MUE
Thrombin 0.88±0.04 0.35±0.04 0.71±0.24 0.76±0.13 0.76 0.46
TYK2 0.87±0.02 0.60±0.04 0.89±0.07 0.75±0.11 0.57 1.07
PTP1B 0.83±0.04 0.84±0.06 0.80±0.09 0.89±0.12 0.71 1.06
JNK1 0.81±0.02 0.85±0.04 0.85±0.07 0.78±0.12 0.47 1.07
MCL1 0.79±0.02 1.30±0.06 0.77±0.05 1.16±0.10 0.65 1.52
BACE 0.78±0.03 1.08±0.05 0.78±0.07 0.84±0.08 0.43 1.20
p38 0.72±0.04 1.44±0.05 0.78±0.07 0.84±0.08 0.38 1.20
CDK2 0.69±0.09 1.02±0.08 0.48±0.19 0.91±0.12 0.47 0.97

GPU加速的原理

FEP linker

Figure 2. FEP默认采用全连接、双向网络进行计算

如图2所示,Flare默认采用全连接、双向网络进行FEP计算,每个连接(link)有9个λ窗口(默认值,可以调整),正常模式下每个连接计算两次(A->B与B->A, 即双向计算),所以每对连接在一起的分子有18个λ窗口需要计算。每个λ窗口计算都是互相独立的,因此可以同时一起进行计算。图2的网络共有8对接接,因此有8x2x9=144个λ窗口需要计算。因此,如果你有144个GPU可供使用,那么图2的网络可以在1-4个小时内完成计算,具体所需机时取决于所采用的GPU卡计算速度。

Cloudam云E算力平台: 为FEP计算提供近乎无穷的算力

Cloudam的云E算力平台整合了全球主流公有云近50个地域的高性能计算资源,开箱即用,无需硬件投入、无需运营维护、无需任务排队,支持一键式提交作业,具备自主学习与深度学习能力,能够根据用户的实例类型与计算要求智能推荐匹配合适的计算机型,将计算的虚拟损耗降至最低,提升计算效率,降低计算成本。

广州墨灵格信息科技有限公司(以下简称墨灵格或Molcalx)与深圳云端软件有限公司(Cloudam)为了方便用户对算力与安全性的需求,合作为客户提供公有云、公私混合云计算方案。在本教程中,将演示如何用Cloudam的云E算力平台来加速FEP计算。

以图2网络的FEP计算项目为例,采用10张GPU卡需要28小时完成,而采用144张卡仅需要2小时完成,而两者的计算成本是一样的:都是144*2=288GPU卡时,云计算的弹性、可扩展性优势显而易见!

计算规划与资源准备

  1. 在Cloudam创建账号
  2. 为了方便您体验FEP与云计算平台的便利性,Cloudam推出了初次注册账号赠送200元代金券的活动。200元足够您进行常规的学习、测试目的,以及Flare、SPARK、Forge、Ligandscout等软件基于结构与基于配体的计算方法,也足够10张卡20小时的计算机。如果您需要更多的机时进行测试,需要预先充值。

  3. 软件的获取与准备
  4. 我们提供Flare/FEP的测试license,在提供FEP 测试license之前,您需要与Cresset签署保密协议;此外,你还需要做必要的准备:1)准备好您的蛋白结构;2)准备好配体,这些配体应该预先对接到蛋白结合位点里;3)如果用自己的GPU计算资源,请准备好至少10GPU卡的计算集群。

    如果您没有自己的GPU集群,那么我们需要收取2000元的测试费(开具发票)充值到Cloudam计算平台或者由墨灵格提供计算资源,以确保您有足够的机时进行测试。不同的测试需要使用的资源不同,因此测试费用会因具体项目的不同而不同。

    注意:炼金术法相对结合自由能计算要求化合物是同系物,具有公共的骨架,化合物之间具有一定的相似性,并且电荷一致。请在准备配体结构时要注意这一点。如果不能满足这个,推荐使用WaterSwap进行绝对结合自由能计算方法,具体见:FLARE教程 | WaterSwap计算结合自由能

注册并登录cloudam

如果您尚未这样做,则需要注册一个云端cloudam帐户。注册后登录到控制台,如图3所示,您将看到一个首页。在首页中选择产品云E算力平台,同意法律条款,平台将赠送200元的云E算力平台代金劵,领取代金券开始创建作业。

cloudam

Figure 3. 注册并登录cloudam账户

文件与目录管理

注册cloudam账户之后,将创建一个用户名为cloudam的linux用户,其HOME目录为/home/cloudam。如图4所示,首页左侧的“云E算力平台|我的云文件”可以将你的文件系统以图形的方式呈现出来。“我的云文件”的一个基本功能可以看成是filezilla或WinScp:创建目录、上传与下载文件。图2展示了“我的云文件”,可以浏览home目录下的所有文件,并可以管理(上传、下载、创建、删除等)云端的文件与目录了。

我的云文件

Figure 4. 我的云文件

在“我的云文件”目录树里,每个目录的右侧有三个竖点标记,点击该标记可以对该目录进行:删除、创建子目录(新建文件夹)、重命名与下载等操作;同时,在右的对话框里,可以对选中的目录里的文件或子目录进行浏览、下载等各种操作。

现在,你可以将你感兴趣的软件,上传到你的HOME目录或其他目录。在本演示中,需要将Flare与Broker上传到/home/cloudam目录(即“~”目录)。

云桌面:启动软件安装节点、ssh登录与软件安装

在cloudam里我们需要建立桌面节点来安装软件,安装的软件将会自动挂载到作业启动的集群节点上,如有需要可以启动管理节点来帮助您更好的开展工作。

1. 启动桌面节点

如图1所示,在首页左侧,点击“云E算力平台|云桌面”,点击“开启桌面节点”,弹出“启动桌面节点”对话框(图5)。

启动桌面节点对话框

Figure 5. 启动桌面节点对话框

从对话框可知,桌面节点分两大类:软件安装节点与作业管理节点。现在我们的目的是安装软件,因此我们点击“软件安装节点”对话框右侧的“启动”按钮即可。启动桌面节点的过程是创建启动一个linux服务器的过程,需要一点时间等待,然后会出现如图6所示的“桌面节点启动成功”的消息框。

桌面节点启动成功消息框

Figure 6. 启动桌面节点启动成功消息框

2. 连接桌面节点

点击“连接桌面节点”,返回到“桌面节点”对话框(图7),会见到“软件安装节点-Linux基础版”的图标,在操作行有:终止,连接的选项。我们点击连接,切换到webssh界面(图5)。现在你可以通过shell界面来安装软件了。

webshell

Figure 7. webshell的软件安装界面

我们将在webshell里安装软件。

2.1 安装软件到/home/cloudam目录

安装Flare:

1
tar -Jvxf flare.tar.xz

安装Broker:

1
tar -Jvxf CEB2.tar.xz

2.2安装License

将license文件复制到安装目录下的cresset/licenses目录。

3. 终止云桌面

软件安装完毕,如果不继续使用webshell,则在“E云算力|桌面节点 |软件安装节点-linux基础版”里点击终止以释放桌面节点。注意:如果不进行终止操作,则会被持续计费,直到释放桌面节点。

Flare/FEP详细操作过程

1. 启动服务器端BROKER服务

1.1 启用计算节点

因为我们要使用GPU进行FEP计算,因此在“云E云算力|桌面节点|开启桌面节点”对话框,点击“桌面节点 管理节点Linux-GPU”的启动按钮,此时会弹出选择计算节点对话框。

1.2 选择计算节点

我们选择4个CPU核心、1张GPU卡的计算节点(此处我选择了“白鲸”的计算节点)就可以,每核心配2GB的内存。

NVIDIA TESLA T4

Figure 8. 选择计算节点“白鲸”

1.3 webshell命令行界面

现在你进入了shell界面了(图9),与普通的Linux shell没有任何区别。

webshell命令行界面

Figure 9. shell命令行界面

记住shell窗口上URL里的IP,该IP在后面会用到。

1.4 启用broker服务

Flare通过BROKER使用云端的计算资源,下面命令的”-g 200″,告诉云计算平台:一次最多使用200张GPU。

1
2
module add libGLU/9.0.1-GCCcore-9.3.0
nohup ~/cresset/CEBroker2/bin/CEBroker2 -v -p 9100 -P 9101 -e -m 80 -M 20 -g 200 -s ~/cresset/CEBroker2/documentation/examples/start_SLURM_engine.sh < /dev/null > ~/cebroker/cebroker2.log 2>&1 &

2. FEP计算

2.1 Flare客户端的配置

在本地机器上,打开Flare,File | Preferences | Processing

如图10所示,在”Cresset Engine Broker”方框里,将Cloudam计算节点的IP地址填入HOST/IP,将端口填入到Port(这里是9100),然后勾选enable,点击Test Connection按钮,如果验证通过则返回”Connection OK”。

Flare: 本地配置

Figure 10. 本地Flare的设置

2.2 Flare/FEP: 新建FEP项目

打开演示项目文件

Figure 11. 打开演示用的Flare项目

用Flare打开我们提供的Flare项目,里面包含了一个蛋白与7个已经对接到结合位点的化合物。如图11所示,在Ligand表单区(1)按住Control键,依次用鼠标点击选中需要计算的7个化合物;在Protein表单区(2),用鼠标点击准备好的蛋白5E7N_P;然后点击Flare Ligand | FEP | New FEP Project,弹出New FEP Project对话框(图12)。

新建FEP对话框

Figure 12. 新建FEP项目对话框

在FEP项目对话框里,可以设置:需要计算的化合物,与这些化合物关联大蛋白;还可以设置这些化合物的活性值进行方法学验证。然后点击Create按钮。

2.3 Flare FEP生成图

上一步点击Create按钮后,弹出Flare FEP generate GRAPH对话框(图13)。

FEP Generate graph

Figure 13. Flare FEP生成图对话框

Graph Type下拉菜单有两种:(1)Normal,即创建全连接网络;(2)Start graph,以选中的化合物为中心,生成星型的网络。这里,我们用Normal mode。

Mode下拉菜单有两种:(1)Benchmark模式:在该模式下,化合物的实验活性数据对计算结果不影响,适合于方法学验证;(2)Product模式:化合物的活性实验会被用于调整图的生成,并用于活性预测。在本演示里,我们选择Benchmark模式。

设置好之后,点击Generate Graph按钮,现在Flare开始云上的计算资源开始计算,生成图很快就看到结果,如图14所示。

FEP生成图的计算结果

Figure 14. Flare FEP生成图的结果

图是可以修改与编辑的,比如添加连接,修改连接方式等等。这里,我们直接开始下一步的FEP计算。

2.4 FEP计算

点击“Run FEP”按钮,弹出“Flare FEP Calculation”对话框(图15)。

RUN FEP对话框

Figure 15. Flare FEP Calculation对话框

我们采用默认值进行计算,所以直接点击Start按钮。注意:这里的Windows Lambda是9,从图14可知,我们的网络有8个link,每个link都是双向计算,因此总共有9x8x2=144个&lambda;窗口需要计算。

Flare FEP Calculation会实时报告目前的进度与资源的使用情况,将鼠标悬停于“More Details”旁边的文字上,会给出详细的资源使用情况,如图16所示。

FEP计算资源使用情况

Figure 16. Flare FEP Calculation资源使用情况

我们可以看到,现在使用了148张GPU卡进行各种计算。详细的计算内容,点击more details可以看到,如图17所示。

详细的计算内容展示

图17. Flare FEP Calculation展示详细的计算内容

完成全部计算需要1个多小时。

结果分析

略,我们已经保存了一个计算完毕的结果,可以提供给您参考。

小结

  1. 本教程演示了Flare FEP如何借助Cloudam的云E弹性计算的GPU计算资源进行FEP计算。
  2. 整个过程非常简单、便利,借助于Cloudam的近乎无穷的计算资源,将耗时、费力的FEP计算轻松完成。
  3. 云E算力平台的优势显而易见:同样的费用使用更多的计算资源,成倍地加速地获得计算结果。

文献

  1. Kuhn, M.; Firth-Clark, S.; Tosco, P.; Mey, A. S. J. S.; Mackey, M.; Michel, J. Assessment of Binding Affinity via Alchemical Free-Energy Calculations. J. Chem. Inf. Model. 2020, 60 (6), 3120–3130. https://doi.org/10.1021/acs.jcim.0c00165.
  2. Wang, L.; Wu, Y.; Deng, Y.; Kim, B.; Pierce, L.; Krilov, G.; Lupyan, D.; Robinson, S.; Dahlgren, M. K.; Greenwood, J.; et al. Accurate and Reliable Prediction of Relative Ligand Binding Potency in Prospective Drug Discovery by Way of a Modern Free-Energy Calculation Protocol and Force Field. J. Am. Chem. Soc. 2015, 137 (7), 2695–2703. https://doi.org/10.1021/ja512751q.
  3. Song, L. F.; Lee, T.-S.; Zhu, C.; York, D. M.; Merz, K. M. Using AMBER18 for Relative Free Energy Calculations. J. Chem. Inf. Model. 2019, 59 (7), 3128–3135. https://doi.org/10.1021/acs.jcim.9b00105.

联系我们

我们不仅提供药物设计软件,对于预算不足或没有计算专家的团队,还提供FEP计算服务。