摘要:3D-QSAR是OpenEye云计算平台ORION一个用于预测结合亲和力的方法,其利用分子的完整三维相似性,使用形状(来自ROCS)和静电(来自EON)作为特征化手段来建立模型。结果表明,我们的模型性能表现与现有方法相当,在某些方面甚至超越现有方法。此外,3D-QSAR能够自动提供预测误差,帮助用户基于正确的理由准确地识别出适合的化合物。

作者:Shyamal Nath and Jingyi Chen
单位:OpenEye, Cadence Molecular Sciences
原文:https://www.eyesopen.com/science-briefs/3d-qsar-machine-learning

OpenEye 3D-QSAR的特点

  • 基于形状、颜色和静电学特征构建机器学习模型
  • 在预测中附带置信度
  • 利用模型解释来指导新分子的设计

概述

使用机器学习或定量结构-活性关系(QSAR)来估算小分子与蛋白质靶标的结合亲和力是药物发现中一种流行的方法。我们开发了一种名为3D-QSAR的QSAR方法,用于预测结合亲和力,该方法利用分子的完整三维相似性,使用形状(来自ROCS)和静电(来自EON)作为特征化手段来建立模型。

3D-QSAR的预测结果与已发表的方法相当,或优于已发表的方法

图1. 3D-QSAR的预测结果与已发表的方法相当,或优于已发表的方法

当预测超出训练集数据时,QSAR模型可能会受到限制。为解决这一问题,我们的3D-QSAR预测结果包含误差估计,这有助于用户将资源集中在预测信心较高的分子上,并识别对改进模型具有最大影响的实验数据。误差估计还可用于指导用户判断是否需要采用更严谨的方法,如使用基于物理的OE Affinity方法来进行结合自由能计算。

结合位点中氢键受体(品红)和供体(黄色)的有利区域

图2. 结合位点中氢键受体(品红)和供体(黄色)的有利区域。3D-QSAR模型还提供了结合位点解释,说明特定相互作用有利的区域,这些解释可用于生成新的苗头化合物优化思路。

结果表明,我们的模型性能表现与现有方法相当,在某些方面甚至超越现有方法。此外,3D-QSAR能够自动提供预测误差,帮助用户基于正确的理由准确地识别出适合的化合物。

如何获取3D-QSAR

3D-QSAR是OpenEye云计算平台ORION的一个模块,目前在大中华地区只能以计算服务(FTE)的方式来使用3D-QSAR。