摘要:本教程以COX-2抑制剂为例,演示了如何用Forge建立3D-QSAR模型的流程:1)导入参比化合物;2)导入训练集化合物与3)测试集化合物;4)自动构象搜索、分子叠合,PLS分析,生成模型与模型验证。通过本练习,您会掌握Forge的使用方法、并实现分子结构导入,构象搜索以及分子叠合与3D-QSAR建模、分析与靶点预测。

作者:肖高铿
联系:gkxiao@molcalx.com

一. 背景

教程以COX-2抑制剂为例讲解如何用Forge建立COX-2抑制剂的3D-QSAR模型。
建模前准备工作:
1)训练集化合物:training.sdf
2) 测试集化合物:test.sdf
3) 确认参比化合物:reference.sdf, 一般为活性最高的化合物的一个可能活性构象(另有教程介绍如何预测活性构象)

二. 操作步骤

  1. 新建项目,使用项目模板开始3D-QSAR建模
  2. File > New Project 或者点击菜单栏New按钮建立一个新的项目

    弹出New Project对话框,选择一个项目模板,点击“Build Activity Model”使用该模板开始3D-QSAR建模, 如图1所示。

    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图1. Forge的项目模板

    Forge提供了多种QSAR建模方法,适用于不同的目的,本文要建立3D-QSAR模型,所以选择Field QSAR Model,如图2所示。

    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图2. Forge的QSAR模型有三种:Field QSAR Model(3D-QSAR),Activity Atlas与kNN。

    Forge可以根据自己的数据集是否预叠合进一步进行选择:你可以用第三方软件比如分子对接预先叠合好化合物,也可以让Forge进行构象搜索、再进行化合物叠合。
    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图3. 可以使用预先叠合好的分子结构也可以让Forge对化合物进行构象搜索、分子叠合

    如果你的化合物还没有进行叠合过、则需要选择:No, My Molecules need aligning.

    Forge会进一步提问:你的数据是否已经分组为训练集与测试集。本教程我们以及预先分成两组,因此选择Yes,I have seperate training and test sets.

    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图4.Forge的3D-QSAR建模需要对数据进行分组:训练集与测试集

  3. 读入参比化合物
  4. Forge接着提示导入参比化合物(见图5),注意:参比化合物一定是个化合物的3D构象,同一个化合物不同的构象建立的3D-QSAR模型很可能会非常不同,最合理的构象是活性构象。活性构象可以1)从配体-受体复合物结构提取,2)也可以用Forge的FieldTemplater模块来预测化合物的活性构象;3)还可以用Forge对参比化合物进行构象搜索,取低能构象集,每个构象分别作为参比化合物建立3D-QSAR模型,然后从多个3D-QSAR模型择优使用。

    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图5. 导入参比化合物

    点Broser导入化合物,Forge接着会是否使用Forge来定义质子化状态还是用输入文件的质子化状态,这里我们直接使用化合物输入文件的质子化状态就可以,见图6。

    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图6. 参比化合物的质子化状态设定

    点击Next按钮进入下一步读入训练集化合物。

  5. 读入训练集化合物
  6. 基本流程与上一步读入参比化合物一致,根据情况选择读入模式。本教程中每个化后已经生成好3D结构,但构象没有搜索、也没有进行过叠合,选择autodetect就可以,见图7。
    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图7. 训练集化合物的读入模式

    点击Next按钮,进入下一步,进行活性数据设定,见图8。

    图8. 活性数据的设定:需要预先在SDF文件将化合物的活性数据体现在结构文件里。

  7. 读入测试集化合物
  8. 同“读入训练集化合物”操作步奏。

  9. 读入靶点蛋白
  10. 如果参比化合物从配体-受体复合物结构提取出来的活性构象,还可以读入该蛋白结构以便叠合时考虑到蛋白的“bump”影响。

  11. 可选步骤:读入待预测活性化合物
  12. 设定参比化合物的场
  13. 对场点进行编辑可以获得更好的计算结果,编辑完毕点Finish结束进入下一步骤。

    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图9. 可以根据您对项目的了解,对参比化合物的场点进行编辑:删除无用的场点、约束长点大小等。

  14. 开始建模:构象搜索、分子叠合、3D-QSAR模型生成多任务一键自动完成
  15. Forge processiong对话框,点击Start开始构象搜索、分子叠合与3D-QSAR建模。,也可以分别代开构象搜索与分子叠合模块进行个性设定,最后点击Start按钮开始作业。

    其中构象搜索的参数可以参考:http://blog.molcalx.com.cn/2016/06/04/torch-tutorial-conformation-hunting.html

    其中分子叠合可以参考:http://blog.molcalx.com.cn/2016/06/04/torch-tutorial-align.html

    Forge教程 | 3D-QSAR建模-墨灵格的博客

    图10. Forge processiong对话框,点击Start开始构象搜索、分子叠合与3D-QSAR建模。

  16. 模型分析
  17. 上一步结束之后会自动生成统计学参数以评估模型质量、还可以观察分子的形状与静电场对活性的影响。

三. 视屏教程

四. 注意事项

1,参比化合物的构象很重要
可以用药效团方法、分子对接方法预测化合物的可能活性构象,或者用构象分析方法搜索可能的活性构像:每个构象建立一个3D-QSAR模型。模型越多,命中的概率越大。
2,参比的化合物只需提供一个构象并且不行进构象搜索
训练集化合物与测试集化合物进行了构象搜索,并且叠合到参比化合物上;参比化合物没有被进行构象搜索、仅利用了输入的那个构象。
3,输入文件要求
推荐采用SDF格式,并将活性值以IC50或pIC50的方式表达,包含在SDF文件里。

五. 接下来可以做什么?

1,为参比化合物生成多个构象,每个构象依次建模,获得最可能的3D-QSAR模型;
2,用3D-QSAR模型指导结构改造;
3,用3D-QSAR用来预测新化合物的活性。

五. 试用

软件下载:http://www.cresset-group.com/try-a-free-demo
信息提交: