摘要:Activity Atlas1 是 Forge 2 中的一个模块,而Forge 是 Cresset 用于配体设计和 SAR(结构-活性关系)分析的强大工作平台。Activity Atlas 模型将一系列化合物的 SAR 总结为一个可视化的3D模型,这个模型可以为设计决策提供信息,并帮助对待需合成的化合物进行优先级排序。这种方法对于那些传统3D-QSAR方法因缺乏足够的 SAR 数据而无法应用的项目团队来说尤为有用。在这个案例研究中,使用 Activity Atlas 分析了一组腺苷A1、腺苷A2a和腺苷A3受体拮抗剂的 SAR,目的是研究并理解这些拮抗剂在受体选择性背后的静电、疏水性和形状特性。

作者:Giovanna Tedesco. Cresset, Cambridgeshire, UK
编译:肖高铿

前言

Activity Atlas 是一种概率方法,用于分析一组叠合好的化合物的结构-活性关系(Structure-Activity Relationships,SAR),作为其静电、疏水性和形状属性的函数。Activity Atlas采用贝叶斯方法对数据进行全局定性分析。结果通过 Forge (注:由于产品的发展,现在是Flare的一个模块)的可视化功能显示,以更好地理解底层的 SAR 特征,这些特征决定了您这一组化合物的结构-活性关系。

Activity Atlas 计算并以3D可视化形式展示以下内容:

  • ‘Activity cliff summary’: 活性悬崖(Activity Cliffs)告诉我们关于构效关系(SAR, Structure-Activity Relationship)的哪些信息?
  • ‘Average of actives’: 活性分子的共性是什么?
  • ‘Regions explored’: 在此之前都进行了哪些研究工作?研究一个新的分子是否会提升我们对该领域的理解?探索过的区域分析还为每个分子计算了一个新颖性打分。

在这个案例研究中,使用 Activity Atlas 中的活性悬崖总结(activity cliff summary)方法来分析一系列已发表的腺苷A1、腺苷A2a和腺苷A3受体拮抗剂的结构-活性关系(SAR),目的在于理解决定A2a相对于A1以及A2a相对于A3选择性的静电、疏水性和形状特征。

数据集

最初由Dimova和Bajorath等人3发表的含342个化合物的数据集,连同它们对腺苷A1、A2a和A3受体的活性值一起,可从补充材料中下载。为了进行Activity Atlas分析,从中选取了一组包含102个三环化合物(见图1)的子集。

用于叠合102个腺苷受体拮抗剂数据集的参比化合物

图1. 用于叠合102个腺苷受体拮抗剂数据集的参比化合物

在Forge中使用列脚本编辑器(Column Script Editor)来计算选择性。编辑器采用JavaScript语法,以简单编程的方式操作分子的关键属性(如原子)和项目中的列数据(见图2)。选择性的计算方法如下:

  • A2a over A1 selectivity = pA2a potency – pA1 potency
  • A2a over A3 selectivity = pA2a potency – pA3 potency
列脚本编辑器

图2. 列脚本编辑器是一种简单且编程化的方式,用于在分子表单中创建或修改值。

化合物的构象搜索与叠合

Cmpd321、296和249(见图1)被选为参比结构,以引导102个化合物完整训练集的叠合。

在Forge中对Cmpd321进行了构象搜索:选择了一个伸展开的低能量构象作为初始参比结构,然后通过最大公共子结构(Maximum Common Substructure)方法将Cmpd296和Cmpd249与之叠合。

然后,使用“非常准确但缓慢(very accurate but slow)”的构象搜索设置,通过最大公共子结构(Maximum Common Substructure)方法,将训练集中的102个化合物叠合到图1中的三个参比化合物:

  • Max number of conformations: 1000
  • RMS cut-off for duplicate conformers: 0.5
  • Gradient cut-off for conformer minimization: 0.1 kcal/mol
  • Energy window: 3 kcal/mol

在Activity Atlas中使用的3D相似性指标需要(如同3D-QSAR一样)将所有的化合物叠合整齐,并且它对错误叠合和叠合噪声敏感。因此,始终建议对叠合结果进行目视检查,以确保没有异常情况存在。当计算的叠合不理想时,可以采用手动干预来改善它。在这个案例研究中,通过翻转苯脲侧链上的苯环(见图1),手动调整了几个化合物的叠合,以便在整个数据集中一致地对齐邻位和间位取代基。

Activity Atlas 模型是按照概率方法计算的,该方法考虑了分子正确叠合的概率,如下面的图3所示,而不是假定打分最高或选定的首选叠合就是正确的叠合。

这是通过为每个叠合结果赋予一个基于其相似性打分的权重来实现的。对于相似性得打高于某一阈值(该阈值可以由Forge自动计算,也可以由用户手动定义)的叠合,被认为是完全可信的。而对于相似性得分低于相似性阈值下限的叠合,则不被信任并予以舍弃。对于具有中间相似性打分的叠合,则应用线性缩放来赋予适当的权重。

分析绝对和相对叠合打分以评估叠合的正确性

图3. 分析绝对和相对叠合打分以评估叠合的正确性

同样地,每个分子也根据其活性赋予一个权重。对于活性高于某一阈值的分子(该阈值可以由Forge自动计算,也可以由用户手动定义),被认为是完全活性的。而对于活性低于活性阈值下限的分子,则被认为是没有活性的。具有中间活性水平的分子则被认为只有部分活性。

Activity Atlas模型

每次运行Activity Atlas实际上会执行三种类型的分析:活性平均(average of actives)分析、活性悬崖总结(activity cliff summary)分析和探索区域(regions explored)分析,这些分析简要概述如下。

活性悬崖总结分析(Activity cliff summary analysis)

该分析有助于您确定SAR(结构-活性关系)的关键区域,提供了一组源自Activity Miner4模块的数据集的活性悬崖可视化3D总结。

为此,创建了一个由3D网格点(lattice)组成的网格(grid)以覆盖数据集中叠合整齐分子的整个体积空间,并且对于每个网格点和每对分子,按照以下方式计算一个系数:

$$
𝐶𝑜𝑒𝑓𝑓 = (𝐷𝑖𝑠𝑝𝑎𝑟𝑖𝑡𝑦 − 𝑀𝑖𝑛𝐷𝑖𝑠𝑝𝑎𝑟𝑖𝑡𝑦) \times 𝛥𝐹𝑖𝑒𝑙𝑑_{𝑥𝑦𝑧} \times 𝑊𝑒𝑖𝑔ℎ𝑡
$$

其中:

  • 𝐶𝑜e𝑓𝑓 是网格点的系数
  • 𝐷𝑖𝑠𝑝𝑎𝑟𝑖𝑡𝑦 是分子对的差值
  • 𝑀𝑖𝑛𝐷𝑖𝑠𝑝𝑎𝑟𝑖𝑡𝑦 是分子对差值的最小值
  • 𝛥𝐹𝑖𝑒𝑙𝑑𝑥𝑦𝑧 是该点上分子对的场差值
  • 𝑊𝑒𝑖𝑔ℎ𝑡 是分子权重和叠合权重的乘积

此计算会在每个网格节点上针对所有场类型重复进行。

活性平均分析(Average of actives analysis)

该模型通过分析数据集中活性分子的共有特征,展示了平均活性分子的样子。

为此,对于覆盖所有叠合整齐分子的3D网格中的每个网格点,以及针对每个分子,按照以下方式计算一个系数:

$$
𝐶𝑜𝑒𝑓𝑓 = 𝐹𝑖𝑒𝑙𝑑_{𝑥𝑦𝑧} \times 𝑊𝑒𝑖𝑔ℎ𝑡
$$

其中:

  • 𝐶𝑜𝑒𝑓𝑓 是网格点的系数
  • 𝐹𝑖𝑒𝑙𝑑𝑥𝑦𝑧 是活性分子在该网格点上的场值
  • 𝑊𝑒𝑖𝑔ℎ𝑡 是分子权重和叠合权重的乘积

此计算会在每个网格节点上针对所有场类型重复进行。

探索区域分析(Regions explored analysis)

第三种也是最后一种Activity Atlas模型与活性分子平均值分析类似,但完全不考虑生物活性。其目的是评估在叠合好的分子里哪些区域已经被充分探索。

该方法通过计算3D网格中每个网格点的场值来工作。如果在某个网格点位置有超过10个分子(这个数量可以由用户定义)的场值大于5,那么该位置就被认为是充分探索过的。

Activity Atlas中的探索区域分析可以用于计算数据集中每个化合物的新颖性打分,以及为新设计的化合物计算新颖性打分。

结果

数据集中102个腺苷A2a、A1和A3拮抗剂的活性悬崖总结选择性分析结果在图4中以3D图的形式展示。

这些3D可视化提供了关于决定A2a选择性的静电、疏水性和形状特性的清晰指示。

为了提高A2a相对于A1的选择性(图4 – 上),可以调整苯环右侧的取代模式:在对位增加立体体积或疏水性将有利于提高选择性,而在间位增加立体体积或疏水性则会对选择性不利。此外,在间位附近产生更正(或更不负)静电场取代基也有利于提高选择性。

关于A2a相对于A3的选择性,最具选择性的化合物是那些骈合氨基嘧啶片段的化合物(在图4-下以绿色显示),正如在-NH2前方的大片正静电场区域所清楚显示的那样;而携带苯脲或苯酰胺侧链的化合物(在图4-下以橙色显示)通常对A3更具选择性。对于这类取代的化合物,在苯环的对位增加立体体积不利于“A2a相对于A3”的选择性,而在间位增加立体体积或疏水性则有利于选择性。

Activity cliff summary maps for A2a over A1
Activity cliff summary maps for A2a over A3

图4. A2a相对于A1(上)和A2a相对于A3(下)选择性的活性悬崖总结图。3D图叠合到在训练集中最具选择性的化合物(左侧,以绿色显示)和选择性最低的化合物(右侧,以橙色显示)之上。

对于分子的左侧,大的疏水基团不利于“A2a相对于A1”的选择性,但对于“A2a相对于A3”的选择性则是有利的。

图5、6、7通过使用Activity Miner计算并显示的活性视图详细探讨了选择性的结构-活性关系(SAR)。Activity Miner是Torch5(注:目前Torch不再单独提供,其全部功能可从Flare获得)和Forge中的一个模块,提供了复杂SAR的快速导航。

Activity view map for ‘A2a over A1’ selectivity

图5. “A2a相对于A1”选择性的活性视图,展示了苯环不同取代模式的效应。标签的颜色编码:绿色表示对位取代化合物的“A2a相对于A1”值;红色表示间位和间位、对位取代化合物的“A2a相对于A1”的值。

图5展示了调节苯脲侧链上环取代基对“A2a相对于A1”选择性的影响。对位甲基取代的化合物Cmpd18(位于中间)是训练集中最具选择性的化合物之一。与活性悬崖总结图的结果一致,可以看出,用较大的疏水性取代基(如-Br、-OMe、-CF3)替换对位的甲基通常是可接受的,而在间位诸如-Cl、-OMe之类的取代基通常会对选择性产生不利影响。

图6展示了对位甲基化合物(左侧)和两个选定的间位及间、对位取代化合物的静电场差异。在间位周围具有更负静电场的取代基对选择性不利,这再次与活性悬崖总结分析的结果一致。

Electrostatic field differences for the p-Me compound (right) and meta- substituted compounds

图6. 对位甲基取代化合物(右侧)和间位取代化合物的静电场差图。在间位周围具有更负的静电场的取代基对“A2a相对于A1”的选择性不利。

最后,图7展示了调节骈合吡唑环上的取代基对“A2a相对于A1”和“A2a相对于A3”选择性的影响。可以看出,再次与活性悬崖总结图的结果一致,体积更大或更疏水的取代基通常对“A2a相对于A1”的选择性有不利影响;而直到某个程度,末端具有立体体积的柔性取代基(例如CH2-CH2-Ph, CH2-CH2-CH2-Ph)可以改善“A2a相对于A3”的选择性。然而,体积非常大的取代基,例如CH2-CH2-萘基或CH2-CH2-2,4,5-三溴苯基,对“A2a相对于A3”的选择性同样不利。

Activity view map for ‘A2a over A1’ and ‘A2a over A3’ selectivity

图7. “A2a相对于A1”和“A2a相对于A3”选择性的活性视图,展示了骈合吡唑环上取代的SAR(结构-活性关系)。顶部数值表示“A2a相对于A1”的选择性;底部数值表示“A2a相对于A3”的选择性。

结论

Activity Atlas 是一种新的方法,用于将一系列化合物的结构-活性关系(SAR)总结为可视化的3D模型,该模型可以用来指导新分子的设计。对于那些传统3D-QSAR方法因缺乏足够的SAR数据而无法应用的项目团队来说,Activity Atlas特别有用,因为它允许对大型SAR表单进行定性分析。在这个案例研究中,成功地应用了活性悬崖总结3D图来汇总一系列腺苷受体拮抗剂的活性悬崖数据,并将其浓缩成一个简单图,展示了SAR中的关键点,从而使得能够解释每个化合物周围的选择性景观。

参考文献

  1. https://cresset-group.com/software/activityatlas
  2. Forge的全部功能现在可以从Flare获得. https://cresset-group.com/software/flare
  3. Dimova, D. et al. (2011) “Design of multitarget activity landscapes that capture hierarchical activity cliff distributions,” Journal of Chemical Information and Modeling, 51(2). Available at: https://doi.org/10.1021/ci100477m.
  4. http://www.cresset-group.com/software/activityminer
  5. Torch的全部功能现在可以从Flare获得. https://cresset-group.com/software/flare

联系我们

想在自己的项目中亲自使用Activity Atlas,请联系我们获取免费的试用版;或者联系我在线演示功能;你还可以采购软件或委托我们进行项目合作:info@molcalx.com。