摘要:形状与静电是分子的两个基本物理性质,如果一个化合物与蛋白的结合位点在形状与静电上互补,那么这个化合物自然而然地成为该蛋白的配体。而药效团是静电的近似,具有相似形状与药效团的化合物可能具有相似的形状与静电,从而可能具有相似的生物学活性与靶点。ROCS是OpenEye公司开发的专门用于比较分子形状与药效团形似性的软件,ROCS不仅可以用于虚拟筛选、也用于靶点预测。本文介绍了如何用ROCS进行化合物的靶点预测,本文不仅提供了文献,还提供了演示网站。​

作者:肖高铿
日期:2017-01-31

一. 为什么要靶点预测

  1. 开发化合物的用途
  2. 老药新用
  3. 预测毒性/副作用,尽早发现风险
  4. 多目标优化:优化药物靶点选择性
  5. 多靶点药物开发
  6. 预测天然产物的靶点,了解作用机理

二. 靶点预测的原理

本文所述的靶点预测指虚拟靶点预测(in silico target fishing/predicting, inverse virtual screening),已经有众多文献综述(英文综述:Cereto-Massagué, A et al. Tools for in Silico Target Fishing. Methods 2015,71:98–103. 中文综述:方坚松,刘艾林,杜冠华. 基于化学信息学方法预测药物靶点的研究进展. 药学学报,2014,49(10):1357-1364),这里不在累述,本文主要介绍ROCS进行靶点预测的基本原理。

靶点预测–基于ROCS的方案与教程-墨灵格的博客

Figure 1. 分子的形状与静电是与结合直接相关的两个物理性质

靶点预测–基于ROCS的方案与教程-墨灵格的博客

Figure 2. 配体-蛋白的形状与静电互补是分子识别的基础

形状与静电是化合物两个基本的物理性质(见Figure 1),也是与蛋白-配体相互识别直接相关的两个基本性质:如果一个化合物与蛋白结合位点在形状与静电上互补,那么这个化合物就自然而然地成为该蛋白的配体(见Figure 2);如果两个化合物具有相似的形状与静电,那么这两个化合物就具相似的生物学靶点与活性。除此之外的其它性质都是这两个性质的近似:1)2D结构相似的两个化合物可能形状与静电相似;2)形状与药效团相似的两个化合物可能具有相似的形状与静电。因为静电信息大计算慢,所以常常采用形状与药效团来比较化合物的3D相似性。

ROCS是OpenEye公司开发的、专门用来比较化合物形状与药效团相似性的软件,我们用ROCS来搜索已知活性化合物数据库来预测化合物的靶点,流程见图3。

靶点预测–基于ROCS的方案与教程-墨灵格的博客

Figure 3. 用ROCS进行靶点预测的流程。1)从待预测化合物生成查询式(query):提取其形状与药效团;2)数据库化合物的叠合:将已知活性/靶点的化合物(已知活性化合物数据库)叠合到查询式上,搜索出所有的与查询式匹配的化合物;3)打分、排序:每个数据库化合物依匹配程度进行打分、排序,相似化合物的靶点可能就是带预测化合物的靶点。

三. ROCS作为计算引擎进活性预测、靶点预测以及老药新用开发的部分文献

(1) Brickelmaier, M.; Lugovskoy, A.; Kartikeyan, R.; Reviriego-Mendoza, M. M.; Allaire, N.; Simon, K.; Frisque, R. J.; Gorelik, L. Identification and Characterization of Mefloquine Efficacy Against JC Virus in Vitro. Antimicrob. Agents Chemother. 2009, 53 (5), 1840–1849.
(2) AbdulHameed, M. D. M.; Chaudhury, S.; Singh, N.; Sun, H.; Wallqvist, A.; Tawa, G. J. Exploring Polypharmacology Using a ROCS-Based Target Fishing Approach. J Chem Info Model 2012, 52 (2), 492–505.
(3) Meslamani, J.; Li, J.; Sutter, J.; Stevens, A.; Bertrand, H.-O.; Rognan, D. Protein–Ligand-Based Pharmacophores: Generation and Utility Assessment in Computational Ligand Profiling. J Chem Inf Model 2012, 52 (4), 943–955.
(5) Vasudevan, S. R.; Moore, J. B.; Schymura, Y.; Churchill, G. C. Shape-Based Reprofiling of FDA-Approved Drugs for the H₁ Histamine Receptor. J. Med. Chem. 2012, 55 (16), 7054–7060.
(6) Mori, M.; Cau, Y.; Vignaroli, G.; Laurenzana, I.; Caivano, A.; Vullo, D.; Supuran, C. T.; Botta, M. Hit Recycling: Discovery of a Potent Carbonic Anhydrase Inhibitor by in Silico Target Fishing. ACS chemical biology 2015, 150701100528002.
(7) Lo, Y.-C.; Senese, S.; Damoiseaux, R.; Torres, J. Z. 3D Chemical Similarity Networks for Structure-Based Target Prediction and Scaffold Hopping. ACS chemical biology 2016, 11 (8), 2244–2253.

四. ROCS靶点预测算例与试用

以几个近期发表的化合物为例,来演示ROCS如何预测靶点:

(一)试用方法

1. 通过网络浏览器,推荐用FireFoxUC等支持H5的浏览器

http://targetfishing.molcalx.com.cn

2. 通过微信公众号

请关注微信公众号:Molcalx,进入公众号,在菜单点击“靶标预测”

提供了阿尔兹海默症、糖尿病,肿瘤与炎症四种疾病的靶标预测。

(二)靶点预测操作步骤

靶点预测–基于ROCS的方案与教程-墨灵格的博客
  1. 画结构,注意手性原子请用键的取向来确定
  2. 问:如何定义手性原子

    答:手性构型通过建的取向来定义:实心楔形键表示朝外,虚线表示朝内,再原有的楔形键上再点击一次,可以切换取向。

    请注意双键两边取代基的取向, SMILESE用"/"与“\”来定义双键取代基的立体化学。

    靶点预测–基于ROCS的方案与教程-墨灵格的博客

    上图左边两个取代基F在同一侧,写为:F/C=C\F; 右边的分子两个取代基在异侧,写为:F/C=C/F。

  3. 画好结构,点击[Get SMILES]按钮
  4. 或者复制一个化合物的SMILES代码,到Get SMILES按钮旁边的文本框里。

  5. 请描述您的作业,以便您看预测报告的时候可以回忆起预测的目的,不同的项目建议加上特征性的词汇。
  6. 请填写姓名(可以乱写,你懂的)与正确的Email,否则收不到结果。

  7. 点击Submit按钮,提交作业
  8. 一般情况下,会在几分钟内结束计算,并返回结果到您的邮箱,请耐心等待。

(三)结果分析

靶点预测–基于ROCS的方案与教程-墨灵格的博客

靶点默认按ShapeTanimoto排序,点击上下箭头可以重新排序;TanimotoCombo(Combo)是ShapeTanimoto(Shape)与ColorTanimoto(Color)的和,这三者的值越高越好。此外,点击Structure行的SMILES代码或search pubchem可以搜索PubChem,以便你确认公开的科技文献、专利以及活性测试实验是否公开过相关的活性;点击PDBID可以转到PDB数据库;点击UNIPROT AC可以查询UNIPROT数据库。

注意

仅根据分值来确定靶标会有比较大的风险,主要是因为分值的可比性因分子的极性基团分布与尺寸变化而变化。同样大小的分子,极性越大的分子比之极性更小的分子其药效团打分偏低,前者打分值假设为0.5,或者可能为0.75,这并不意味着后者比前者更优优势。

强烈建议用ROCS叠合之后,将数据导出,用可视化工具分析(比如目测观察)或药效团、分子对接等技术进一步分析,对可能的靶标进一步排除。

(四)算例

  1. JOB ID:PGS2700493855
  2. SMILES code: O=C(Nc1ccc(Cl)c(Cl)c1)c3ccc2[nH]ncc2c3

    Figure 3. 化学结构式

    Known target: MOA-B

    Reference: J. Med. Chem., 2014, 57 (15), pp 6679–6703 DOI: 10.1021/jm500729

    预测结果(JOBID):PGS2700493855

    结论:真正的靶点MOA-B在33个靶点中排在第2位,ROCS具有显著地靶点富集能力

  3. JOB ID:PGS1804126276
  4. Verubecestat: 临床PIII在研药物,BACE-1抑制剂

    SMILES code: C[C@]1(CS(=O)(=O)N(C(=N1)N)C)c2cc(ccc2F)NC(=O)c3ccc(cn3)F

    Figure 4. Verubecestat的化学结构式

    Known target: BACE-1

    预测结果(JOB ID) : PGS1804126276

    结论:真正的靶点排在第1位,明显区别于其它32个靶点,ROCS具有显著地靶点富集能力。

  5. JOB ID: PGS1808379813
  6. SMILES code: CC(=O)Nc1n[nH]c2ncc(cc12)c3ccccc3

    Figure 5. 化学结构式

    Known target: GSK3-Beta

    Reference: J. Med. Chem. 2008, 51(7):2062

    预测结果(JOBID):PGS1808379813

    结论:真正的靶点排在第1位,ROCS成功的将靶点富集出来。

  7. JOB ID: PGS2193808226
  8. 木犀草素(Luteolin)在小鼠模型上表现出预防NASH的作用(Sagawa H et al. 2015),我们用糖尿病靶点预测模块(DMTP)计算方法来预测木犀草素可能的作用机理。

    SMILES code:O=c2cc(c1ccc(O)c(O)c1)oc3cc(O)cc(O)c23

    Figure 6. Luteolin化学结构式

    Known Target: PPAR-Gamma (EC50=2300nM)

    文献:Sagawa H, Naiki-Ito A, Kato H, Naiki T, Yamashita Y, Suzuki S, Sato S, Shiomi K, Kato A, Kuno T, Matsuo Y, Kimura M, Takeyama H, Takahashi S. Connexin 32 and luteolin play protective roles in non-alcoholic steatohepatitis development and its related hepatocarcinogenesis in rats. Carcinogenesis. 2015

    预测结果:PGS2193808226

    结论:有文献证实PPAR-gamma是炎症靶标,在本计算中,PPAR-Gamma排在第一位,其中打分最高的PDB复合物结构刚好是Luteolin与PPAR-gamma的复合物结构。

五. 总结

  1. ROCS进行靶点预测基本原理是:形状与药效团相似的化合物具有相似的生物学活性与靶点;
  2. 已有文献验证了ROCS可以成功地用于化合物的靶点预测与老药新用;
  3. 我们的在线演示,也成功地将已知活性化合物的靶点找回来;
  4. ROCS简单、易用

六. 联系我们,获取靶点预测全套方案