摘要:WaterSwap是分子对接软件Flare的一个计算模块,专门用来计算配体-蛋白的结合自由能,它可以:1)研究配体结合的能量学特点;2)将结合能分解为每个残基的贡献以发现优选的配体相互作用模式;3) 计算一系列化合物的结合自由能(ΔG of binding)以帮助您优选配体,或者比较几种结合模式以发现最可能的结合模式。本文提供了Flare WaterSwap的计算教程。

一. 背景介绍

WaterSwap是分子对接软件Flare的一个计算模块,它是一种用第一原理、凝聚态模拟计算配体-蛋白结合自由能的方法。详细算法参见:

1. Woods, C. J., Malaisree, M., Hannongbua, S., Mulholland, A.J., “A water-swap reaction coordinate for the calculation of absolute protein-ligand binding free energies”, J. Chem. Phys. 134, 054114, 2011, DOI:10.1063/1.3519057

2. Woods, C. J., Malaisree, M., Michel, J., Long, B., McIntosh-Smith, S., Mulholland, A. J., “Rapid Decomposition and Visualisation of Protein-Ligand Binding Free Energies by Residue and by Water”, Faraday Discussions 169: Molecular Simulation and Visualisation, 2014, DOI:10.1039/C3FD00125C

WaterSwap在计算过程中构造一个反应坐标进行迭代计算:将结合到蛋白的配体“挖出”,然后用等体积的、形状的水填入。其效果是相当于将结合到蛋白的配体转移到溶剂中。同时,WaterSwap也将与配体等体积、形状的水从溶剂中转移到蛋白结合位点去。这种“挖出来”与“放进去”的路径实际就是蛋白-配体的解离、结合路径。WaterSwap采用蒙特卡洛模拟(蛋白骨架不动,侧链、配体可以自由运动)来进行构象采集,计算结合结合自由能。

WaterSwap可以用来:

  1. 精确计算配体-受体结合自由能
  2. 预测结合水与可替换水分子位置,用来指导结构改造,提高化合物的结合亲和力与选择性
  3. 能量拆解,可视化分析帮助理解残基对结合的贡献

二. 操作步骤

1. 复合物结构的准备

WaterSwap计算的精度取决于复合物结构模型,如果复合物结构模型错误,计算也就不值一提。

复合物结构可以从PDB数据库下载,采用标准的Flare结构准备流程来获得;也可以预测而得,比如将一个配体采用分子对接计算放入结合位点。如何准备复合物结构与对接,请参见Flare对接教程http://blog.molcalx.com.cn/2017/06/04/flare-tutorial-dock-imatinib.html

2. WaterSwap计算

准备好配体与受体结构之后,就可以开始用WaterSwap计算结合自由能。WaterSwap在Flare菜单Ligand>WaterSwap下,见图1。

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图 1. WaterSwap菜单

点击WaterSwap菜单后,弹出WaterSwap计算对话框,见图2。根据要计算的蛋白与配体对进行设定。

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图2. WaterSwap计算对话框

点击WaterSwap计算对话框的Show Option,有更多的参数可供选择(图3)。WaterSwap的电荷模型可选Gasteiger或AM1-BCC;计算平台可选CPU或GPU,设定好选项之后,点击Start开始计算。

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图3. WaterSwap计算选项

WaterSwap的电荷模型可选Gasteiger或AM1-BCC;OpenMM分子动力学模拟部分计算平台可选CPU或GPU。设定好选项之后,点击Start开始计算,并弹出计算的进度与状态(图4)。

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图4. WaterSwap计算进度

注意:WaterSwap需要很大量的计算资源,以PDB代码为4ZLZ的配体-蛋白复合物晶体结构为例,在一个Linux工作站(CPU:Intel XEON E5-2683 V3 2.0GHz,系统内存:128GB)上,用28核心计算,需要20个小时。普通的笔记本或办公电脑采用(比如i7-4700)需要几天或更长时间,因此不要在笔记本上计算!

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图5. WaterSwap迭代

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图6. WaterSwap计算的结合自由能

我们也会从Flare的进度窗口上看到WaterSwap不断在进行迭代计算(图5),每个迭代都给出4中不同的算法的自由能(图6):

  • Benneet:用Bennett's Acceptance Ratio (BAR)计算的结合自由能
  • TI: 用Thermodynamic Intergration计算的结合自用能
  • FEP:用Free Energy Peturbation计算的结合自由能
  • TI Quadrature:用Thermodynamic Intergration with numerical quadrature计算的结合自由能
  • ΔG(Protein):Total free energy of binding due to the protein box
  • ΔG(Water): Total free energy of binding due to the water box
  • Consensus: Consensus free energy of binding,是上述四种结合自由能的加权平均。
  • Converged: 根据四种自由能算法计算ΔG相似性程度的一种收敛指标。注意,这并非硬标准,应该去检查轨迹以判断是否收敛。

图6是WaterSwap迭代计算的监控结果,一直迭代750次后达到收敛标准。

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图6. WaterSwap计算的收敛与结束。当结合自由能值波动(最大与最小值差)小于1.5kcal/mol时达到收敛,WaterSwap计算结束。本次计算共迭代了758次才达到收敛标准。

三. WaterSwap可视化结果分析

WaterSwap计算完毕,在蛋白表单会新添加两个蛋白,其命名代表着计算性质:如果蛋白名字有"_L"结尾,代表该蛋白是最后一帧分子动力学模拟快照,含有配体,其颜色按WaterSwap能量系数着色;如果名字是"_W"结尾,代表该蛋白含水盒子,其颜色也是按WaterSwap能量系数着色。

配体、水周围的蛋白氨基酸残基按WaterSwap的能量用绿色到红色渐变标度(图7):

  • 绿色越浓的氨基酸残基越倾向于与配体发生结合;
  • 白色氨基酸残基对结合没有贡献或其没有WaterSwap系数;
  • 红色越浓的氨基酸残基越偏向于水发生相互作用。

配体-蛋白(蛋白_L)可视化分析可以告诉我们配体的结合自由能贡献来源:绿色氨基酸残基对配体贡献了大部分的结合自由能;红色的氨基酸残基发生去溶剂化而对配体的结合起不利作用。

FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

图7. WaterSwap可视化分析残基对结合的贡献

水-蛋白(蛋白_W)可视化分析可以告诉我们:在蛋白的活性位点里,哪个地方是水优选的结合位置。水分成两个链:Swap Water与Bound Water。Swap Water是与配体发生互换的水,与配体一起观察,可以帮助在配体设计时发现活性位点里配体应该发生引入亲水基团的地方。Bound Water是那些在结合位点里出现在配体周围的水或水盒子里的水,它们的颜色按能量着色。

四. 注意事项

  1. WaterSwap是计算绝对结合自由能,在计算中忽略了可极化性、结合位点的蛋白部分骨架不动,所以WaterSwap计算的结合自由能是高估的,不能与实验自由能直接进行比较。但是可以计算一些列化合物的结合自能,将之与实验值进行拟合。
  2. FLARE教程 | WaterSwap计算结合自由能-墨灵格的博客

    图9. WaterSwap计算系列化合物的结合自由能,并与实验值拟合

    WaterSwap计算阶段,虽然进行蒙特卡罗模拟(Monte Carlo simulation),但是熵的计算是不完全的,主要是因为:1)蛋白骨架是被约束不动的,仅结合位点部分的侧链可以发生运动。大的蛋白构象变化不会被采集到,因此蛋白的构象熵计算不是完全的;2)在蛋白结合位点里配体虽然可自由移动,但也不会发生取向截然不同的情况,WaterSwap的精度取决于复合物模型的精度。如果复合物模型一开始就是错的,那WaterSwap的结合也不值一提。

  3. WaterSwap计算量很大,为保证在合理的时间内得到结果,建议采用单机多核计算。在我们的测试里,单节点含28核心可以在合理的时间内给出计算结果。
  4. WaterSwap初始是用OpenMM计算,可以用GPU加速,但是这部分实际上耗时较少。WaterSwap计算是最耗时阶段,仅支持CPU计算。

  5. 在进行计算时,WaterSwap默认会将全部CPU用于计算。

四. 文献

方法学文献

Woods, C. J., Malaisree, M., Hannongbua, S., Mulholland, A.J., “A water-swap reaction coordinate for the calculation of absolute protein-ligand binding free energies”, J. Chem. Phys. 134, 054114, 2011, DOI:10.1063/1.3519057

Woods, C. J., Malaisree, M., Michel, J., Long, B., McIntosh-Smith, S., Mulholland, A. J., “Rapid Decomposition and Visualisation of Protein-Ligand Binding Free Energies by Residue and by Water”, Faraday Discussions 169: Molecular Simulation and Visualisation, 2014, DOI:10.1039/C3FD00125C

应用文献

Woods, C. J.; Malaisree, M.; Long, B.; McIntosh-Smith, S.; Mulholland, A. J. Computational assay of H7N9 influenza neuraminidase reveals R292K mutation reduces drug binding affinity. Scientific reports 2013, 3, 3561. DOI:10.1038/srep03561

五. 试用与下载

试用下载:http://www.cresset-group.com/try-a-free-demo