摘要:Ligandscout教程--基于药效团的虚拟筛选:用一个药效团对一个或多个化合物数据库进行虚拟筛选;用多个药效团对一个或多个化合物数据库进行虚拟筛选;基于片段的虚拟筛选。本教程提供了:如何用数据交换部件将药效团复制到screen perspective,如何建立虚拟筛选数据库,如何绘制ROC曲线进行方法学验证与虚拟筛选。
一. Ligandscout虚拟筛选简介
Ligandscout支持基于配体(Ligand-based)与基于结构(Structure-based)的方式生成药效团模型。除了药效团识别,Ligandscout还可以用药效团对化合物数据库进行虚拟筛选:
- 用一个药效团对一个或多个化合物数据库进行虚拟筛选
- 用多个药效团对一个或多个化合物数据库进行虚拟筛选
- 基于片段的虚拟筛选:LigandScout的药效团虚拟筛选支持部分匹配,由此可以进行基于药效团的全新设计
Ligandscout在进行虚拟筛选时,化合物数据库需要预先生成低能构象集,在Ligandscout里由iCon来完成;在大规模虚拟筛选前,最好做一个方法学验证,以便确认该方法确实有富集活性化合物的能力;完成方法验证后,就可以开始安心地进行大规模虚拟筛选。
本教程将以CDK2激酶及其抑制剂为例,演示了如何进行:
- 化合物数据库的准备
- 方法学验证(ROC曲线绘制)
- 虚拟筛选
在演示之前,先介绍一下Ligandscout与虚拟筛选相关的图形交互界面。
- Screening Perspective:虚拟筛选工作界面
- Screening Perspective常用工具
- 数据交换部件
- 药效团列表
- 数据库列表
图1, Ligandscout有四个perspective, Screening perspective是Ligandscout进行虚拟筛选的图形交互界面
Ligandscout有四个perspective:Structure-based,Ligand-based,Alignment与Screening Perspective。其中Screening perspective是Ligandscout进行虚拟筛选的图形交互界面。
初始的screening perspective是空的,需要导入药效团与数据库之后才能进行更多的操作,如图2.
图2, Screening Perspective
数据库加载(Load Screen Database)、虚拟筛选(Perform Screening)、ROC曲线绘制(Plot ROC Curve)、生成虚拟筛选用数据库(Create Screen Database)与药效团删除(Delete Pharmacophore)生成几个常用、重要的工具:
图3, Screening Perspective的几个重要工具
数据交换部件可以将药效团或配体复制到其它的perspective里。在Structure-based与Ligand-based perspective里生成的药效团可以通过数据交换小部件复制到Screening perspective用于虚拟筛选(图4)。
图4, 数据交换部件
通过数据交换部件复制到screen perspective的药效团以及直接从Screen perspective打开的预先保存好的药效团会出现药效团列表下,如图5所示。
图5, 药效团列表
通过单击列表上药效团文字部分,可以选中药效团并加上灰色背景,只有被选中的药效团才用于后续的虚拟筛选,没有被选中的药效团被虚拟筛选忽略。如果虚拟筛选需要用到多个药效团,可以按住Shift键,再单击药效团即可。
注意,被选中的药效团会多一列带花括号的数字,该数字可以通过Boolean操作用于多目标虚拟筛选(多个药效团虚拟筛选,见教程:Ligandscout教程–布尔运算符)。比如在Boolean expressing行键入”1 or 2″进行虚拟筛选,意味着如果一个化合物只要与药效团模型1或2匹配则算命中; “1 and 2″意味着化合物必须与模型1、2同时匹配,很适合于多靶点药物发现; 同理,”1 and (not 2)”意味着化合物与模型1匹配而不与模型2匹配,这在分离化合物两种活性的是否特别有用,比如当模型2为一个心脏毒性药效团模型。如果Boolean表达式写错,在该行的右边就会出现红点;表达式正确,则出现绿点。
通过Load Screen Database按钮可以将预先生成构象的化合物数据库导入用于虚拟筛选。成功导入的数据库会出现数据库列表里,如图6所示。
图6, 数据库列表
数据库名称前要三种标记:灰色原点,红色方框,与绿色方框。用鼠标连续单击该标记,会在三种状态之间切换。
虚拟筛选:灰色圆点的数据库在虚拟筛选中被自动忽略(即不参与虚拟筛选),绿色方框数据库与红色方框数据库将参与虚拟筛选。
绘制ROC曲线:灰色圆点的数据库被自动忽略,而绿色方框数据库被视为已知活性化合物、红色方框数据库被视为decoy化合物而进行虚拟筛选并绘制ROC曲线。
单击数据库后面的”x”号则从数据库列表中卸载数据库(不是从硬盘中删除数据库)。
二. 操作过程
2.1 数据库准备
Ligandscout用iCon生成虚拟筛选用的数据库,可以读取SMILES、sdf或mol2格式文件,保存为ldb文件。
单机Create Screen Database按钮,设置输入与输出,见图7。
图7, Create Screen Database的输入与输出
LigandScout在3.0版用Omega生成构象空间,新版的Lignandscout用iCon来生成构象空间。使用import,还可以导入预先生成构象的数据库。
图8, 选择构象搜索方法,对于大规模虚拟筛选,默认值就可以
如图9,iCon的参数可以根据喜好调节,一般类药化合物库的大规模虚拟筛选用默认值可以兼顾精度与速度。
图9, 设定iCon的参数
构象搜索结束,点击finish按钮即可,见图10。
图10, 构象搜索结束
2.2 导入药效团
两种方式将药效团导入:
- 通过数据交换部件从Ligand-based或Structure-based获得的药效团模型复制而得;
- 外部导入预先保存的药效团
在Ligand-based或Structure-based perspective界面下,用data exchange > Copy current Pharmacophore(s) to > Screen perspective
Screen perspective菜单:File> Insert 鼠标选择预先保存的药效团,弹出Add Pharmacophore对话框:do you want to add the pharmacophores to the query list, 点击Yes即可。
2.3 导入数据库
点击Screen perspective的Load Screen Database,导入2.1生成的化合物数据库,在数据库列表,按数据库性质点击前面的灰色圆圈,设置为合适的状态:灰色,红色或绿色。
2.4 方法学验证–ROC曲线绘制
- 在Structure-based perspective里用PDB 1KE6生成基于结构药效团模型,并将药效团复制到Screen perspective里
- 导入decoy与Ligand数据库
- 绘制ROC曲线
- 图片保存
- 浏览命中化合物与药效团的匹配性
- 导出命中的化合物
分别导入CDK2_decoy.ldb,连续点击灰色圆圈,设置为红色;导入CDK2_ligand.ldb,连续点击灰色圆圈,设置为绿色。
点击Plot ROC Curve, 开始虚拟筛选,生成ROC曲线与报告富集因子,如图11所示。
图11, ROC曲线与富集因子
Ligandscout支持将3D、2D或ROC曲线保存为任意分辨率的高质量图片用与发表文章,在菜单File>Save as file> 将Type of file设置为图片格式,文件保存对话框会提示要保存的是2D、3D还是ROC图,并设定图片大小,点击save file保存,见图12。
图12, ROC曲线图片的保存
如图13所示,虚拟筛选结束,会生成一个”Hit for query”表单,单击表单“name”列可以在2D、3D图上看到化合物与药效团的匹配情况;从表单上也还可以看到打分值,匹配了什么药效团元素。
图13, 结果浏览
Screening perspective: File>Save as file 将Files of type设置为MDL SD File format (SD,SDF),起个名字保存,将文件保存在硬盘的目录里。
记下ROC AUC与EF值,比较不同药效团模型的ROC AUC以及EF值,选择更好的模型用于虚拟筛选: ROC曲线越靠近左上角越好。如果一个药效模型不能将ligand与decoy区分开,那么这个虚拟筛选方法就不适合于进一步做大规模虚拟筛选。
2.5 虚拟筛选
与ROC曲线绘制步奏完全一致,只需要将数据库导入到数据库列表并将数据前的灰色切换为绿色,点击“perform screening”进行虚拟筛选。
三. 相关教程
- 基于配体的药效团生成
- 基于结构的药效团生成
- Boolean运算
http://blog.molcalx.com.cn/2016/09/03/ligandscout-tutorial-ligand-based.html
http://blog.molcalx.com.cn/2016/09/03/ligandscout-tutorial-structure-based.html
http://blog.molcalx.com.cn/2016/08/06/ligandscout-tutorial-boolean-operator.html
四. 联系我们,索要测试版(免费)
电邮:info@molcalx.com
电话:020-38261356
单位:广州市墨灵格信息科技有限公司
网站:http://www.molcalx.com.cn/ligandscout