摘要:除了基于结构的设计之外,ligandscout还擅长于基于配体的设计:从一系列具有相似结合模式的化合物出发识别识别药效团模型。Ligandscout输入文件包含:训练集化合物与测试集化合物。训练集化合物用于生成药效团模型,测试集化合物继续多药效团模型打分,最后输出打分最高10个模型。本教程以CDK2激酶抑制剂为例,演示了导入化合物、化合物聚类、设置训练集与测试集、生成药效团的整个流程。
作者:肖高铿
一. Ligandscout与基于配体的设计
Ligandscout是专业的药效团建模与虚拟筛选工具,除了擅长基于结构的设计之外,还擅长于基于配体的设计:从一系列具有相似结合模式的化合物出发识别识别药效团模型。Ligandscout的输入文件包含:训练集化合物(活性化合物、非活性化合物)与测试集化合物(活性化合物、非活性化合物),训练集化合物用于生成药效团模型,测试集化合物继续多药效团模型打分,最后输出打分最高10个模型。Ligandscout还支持药效团聚类来准备训练集化合物,对输入化合物进行聚类分析,同一类的化合物用于建立药效团模型,同一靶点的不同的药效团模型最后通过Boolean运算合并筛选结果。
二、操作步骤
Ligandscout进行基于配体的药效团识别包含下述步骤:
- 导入配体
- 生成3D结构,对配体聚类
- 生成基于配体的药效团模型
三、详细描述
以CKD2激酶为例说明基于配体的药效团识别过程。
- 导入配体,设置训练集化合物
- 设置训练集化合物
- 根据3D药效团特征对训练集进行聚类
- 设置测试集化合物
- 建立基于配体的药效团模型
- 虚拟筛选与保存药效团模型
假设已知活性化合物以SMILES格式保存在cdk2.smi文件里。
点击Ligand-based切换到Ligand-based模式:File> Open> cdk2.smi
配体被导入,生成分子表单,其2D结构展示在屏幕的右侧, 如图1所示。
图1, 导入训练集化合物
默认条件下,刚导入的化合物处于被选中的状态,在表单中处于高亮、其2D结构也展示于右侧。如果化合物2D结构没有展示,请用按住鼠标左键,在表单的name列,从上往下拖动,则选中被拖过的化合物;或者按住Shift键,在表单name列先单击第一个分子,再单击最后一个分子,则全部的化合物被选中。
确保全部表单化合物被选中的情况下,将全部的化合物设置为训练集化合物,如图2所示。
Ligand-Set> Flag Selected Molecules > as Training Set
图2. Ligandscout提供Flag设置, 方便的给化合物添加各种标签,比如训练集
此时,分子表单标题栏的右边,三个按钮由灰色变为加亮状态(如图3所示),表示已经准备好进行构象生成、聚类与药效团生成了。
A
B
图3. 表单标题栏右边三个按钮的图标变亮,这三个按钮分别生成构象、聚类与药效团生成。
如图3所示,单击Ligand-set旁边的unnamed,可以给当前项目起个名字方便管理,比如CDK2。
点击聚类按钮(第二个按钮:cluster ligand-set),弹出ligand-set clustering setting对话框,全部参数用默认值,再点击OK按钮。
配体表单会出现一个新的列:Cluster ID。点击Cluster id,进行排序。
通过表单控制,将cluser id为1的化合物的type设为“test set”,结果如图示4。
图4. 聚类与设置化合物的type。
注意:聚类后发现,分为5类:其中1,2,3类只有一个化合物,4与5各有两个成员,不属于同一类的化合物不可以用于后面的药效团模型生成。在本文中,只是为了演示操作流程而将不同“类”的化合物一起作为训练集与测试集。实际研究不应该这么做!!!
注意:测试集与训练集的化合物应该尽量多样,最好各自有活性与非活性化合物(如果没有非活性化合物,可以将活性明显低100倍或1000倍的化合物视为非活性化合物)。
点击表单的第三个按钮(Create Ligand-based pharmacophore)按钮,开始生成药效团模型(大约需要2分钟完成)。
“Feature Pattern”展示了药效团元素组成,点击一个色块,会链接向对应的药效团元素。在右下角展示了生成的一组药效团模型:点击不同模型,对应的3D模型与配体就会屏幕上展示出来(见图5)。
图5. 计算结果的界面
点击3D视窗右上角的data exchange小部件将当前药效团复制到其它地方,比如screen prospective进行虚拟筛选;还可以通过”File>Save”菜单将当前所见的药效团另存为一个新文件。
图6. 基于配体的药效团识别流程总结
四. 从这里开始,我能做些什么?
- 将基于结构的模型与基于配体的模型进行叠合
- 在LigandScout里对数据库进行虚拟筛选
五. 基于配体的药效团识别算法与实践技巧
5.1 基于配体的药效团识别算法
Ligandscout药效团识别算法总结如下:
- 用训练集活性化合物生成全部可能的公共药效团模型。
- 用训练集非活性化合物对第一步生成的模型进行打分:被非活性化合物命中的模型打分变差。
- 用测试集活性化合物/非活性进一步对模型进行打分:与活性化合物匹配的模型被加分、不匹配则减分;与非活性化合物匹配则减分、不匹配则加分。
- 模型根据打分值进行排序,保留打分最高的10个模型
鉴于药效团识别过程本质是个SAR的建模过程,因此,对于训练集与测试集化合物的准备也有要求:1)训练集活性化合物结构要多样,不要冗余;2)活性化合物与非活性化合物尽量相似。
5.2 技巧
- 训练集(training set)、测试集(test set)与忽略的(Ignored)化合物设置
- 活性化合物与非活性化合物的设置
- 我怎么知道3D视窗中那些球对应什么样的药效团元素(Feature)?
- 为什么有的药效团元素发虚?
- 为什么有的药效团元素为双色相间?
Ligandscout分子表单支持化合物类型设置:Training-set,Test-set,Ignored。其中Training-set意味着化合物在生成药效团模型作为训练集使用;Test-set意味作为测试集使用;Ignored意味着忽略这个化合物,在建模过程中不考虑这个化合物。有两种方式可以设置化合物的类型:
(1)通过Ligandscout分子表单的Type列的下拉菜单来选择:
(2)通过Flag来设置
选择化合物:在分子表单中,按住Shift键,用鼠标单击Name列要设置的化合物。
再从菜单Ligand-Set>Flag Selected Molecules来设置。
Ligandscout分子表单有Active列,点击Active列下各个化合物对应的方框可以设置活性类型:实心为活性化合物,空心为非活性化合物。是否为活性还是非活性:取决于自己的实验数据。
同训练集与测试集的设置一样,Ligandscout通过Flag可以很方便的批量设置。
用鼠标单击感兴趣的药效团元素,Liganscout的视窗会给出标签,同时左则的Pharmacophore列表对映的药效团元素也被高亮。
这是因为有的药效团元素不是必须而是可有可无的:匹配该元素可能增强活性,不匹配不丧失活性。这类药效团元素在3D视窗上就“发虚”。
Ligandscout用训练集与测试集建立药效团模型,会根据匹配情况自动设置药效团元素是否为option,你还可以手动设置一个药效团元素是否为option:用鼠标单击药效团元素以便选中,然后在菜单中Pharmacophore>Mark Feature as Optional.
Ligandscout支持同一个位点有两个药效团元素:比如既是氢键受体、也是供体。如果出现这样的情况,这两个元素在3D图形上显示为双色相间。
六. 应用案例
Ligandscout应用案例–基于配体的药效团建模与虚拟筛选发现全新17β–羟基类固醇脱氢酶2抑制剂
http://www.molcalx.com.cn/ligandscout_jmc2014
Anna Vuorinen et al. Ligand-Based Pharmacophore Modeling and Virtual Screening for the Discovery of Novel 17β -Hydroxysteroid Dehydrogenase 2 Inhibitors. J. Med. Chem. 2014, 57, 5995 −6007
17β-羟基类固醇脱氢酶2(17β-HSD2)催化雌二醇到雌素酮的失活转化,对它的抑制可作为治疗骨质疏松症,改善雌激素缺乏症的治疗选择。作者使用LigandScout构建了17β-HSD2抑制剂的药效团模型,进行虚拟筛选,生物实验证明29个苗头化合物中有7个具有低微摩尔级IC50活性。为了进一步研究其构效关系(SAR),从SPECS数据库中又挑选了30多个衍生物用于测试。最终发现3个活性最好的化合物,最低活性达240 nM。还发现了1个对17β-HSD1具有选择性的抑制剂,3个对其他相关HSD具有选择性,6个对其他HSD没有影响。
七,联系我们,获取一个月的免费试用
电邮:info@molcalx.com
电话:020-38261356
单位:广州市墨灵格信息科技有限公司
网站:http://www.molcalx.com.cn/ligandscout