摘要:本文以CDK9抑制剂为例,演示了如何使用Flare的R-基团分析(R-Group Analysis, RGA)模块对具有氨基嘧啶公共母核系列化合物进行R-基团拆解,并随后使用箱线图与热图分析R-基团分解结果以发现R基团的活性分布范围,研究不同取代位、取代基对活性的影响以及高活性化合物的取代模式,找出现有研究尚未探索过的化学空间。

作者: Ryuichiro Hara/13 March, 2023
编译:肖高铿

前言

药物发现研究通常涉及对化合物进行小的修饰并研究后续对活性的影响。一旦完成一系列密切相关化合物的合成与活性测试之后,分析哪些取代基增强活性、了解哪些取代基位置显著影响活性对于下一轮合成策略的制定是非常重要的。Flare™中的R-基团分解和分析(R-group decomposition and analysis)是一种允许您根据取代基在给定母核结构中的位置对取代基进行分类的方法,并帮助您识别每个位置上的活性取代基。

如果数据集中的分子具有活性数据,则可以查看各个取代基在各个取代位置的活性值分布。如果同时查看两个取代位置,则可以获得取代基矩阵,这为识别在系列化合物中活性最强结构的取代模式以及了解目前化学探索策略尚未探索的化学空间提供了有用的信息。

在这个例子中,我们展示了如何在Flare中对一组搜集自ChEMBL的CDK9抑制剂进行R基团分析。为了简化数据,ChEMBL报告的IC50,EC50,AC50,Ki和Kd(nM)活性值被视为每个分子的中位活性值。我们将MW大于500或SlogP大于5的分子从数据集中剔除,因为这些分子会干扰分析。准备好的数据集总共包含780种化合物。

定义用于R-基团分解的骨架

该数据集中活性最强的化合物为CHEMBL3694408(图1),它具有4-氨基嘧啶骨架,pActivity=11.3。这是进行R-基团分解分析的好起点。

Flare的R-基团分析(R-Group Analysis)-墨灵格的博客
Flare的R-基团分析(R-Group Analysis)-墨灵格的博客

图1.R-基团分析对话框,可在3D视窗中进行原子选择

单击“Ligand”选项卡中的“R-Group Analysis”图标,这将打开R-基团分析面板。在3D窗口中,选择氨基嘧啶片段并确认在面板中绘制出选中的原子,然后单击“start”按钮。只有在指定的配体角色(注:配体角色,role,是Flare配体表单管理配体的一种方式)中与该子结构匹配的分子才会包含在随后的R-基团分解分析中。

Flare的R-基团分析(R-Group Analysis)-墨灵格的博客

图2. 分解对话框:分析取代位置(左上),属性过滤器(左下),以及用不同颜色来显示与母核连接的R基团分子表单。

在该数据集中发现了72个化合物具有匹配的子结构。分析还表明,在这个“迷你系列”分子中附着的R-基团可以在4个已识别的位置中找到:嘧啶环上的R1、R4和R5,以及环外氨基上的R3,如图2左上所示。此模式中缺少的R2在内部用作双环替换的占位符,并显示在表格视图中。表格视图中的其他列包括化合物图片,其中每个分解的取代基都针对特定位置进行了着色,而被打上勾的分子属性则显示在后面的列中。分解的结果可以通过单击“Transfer to Flare”按钮转移到“配体表单(Ligands Table)”。 配体表单中的以“RGA1”开头的列是第一个R基团分解分析的结果(图3)。后续的R基团分解以“RGA2.”、“RGA3.”等开头来命名列。

Flare的R-基团分析(R-Group Analysis)-墨灵格的博客

图3. 具有R基团分解结果列的Flare配体表单

使用箱线图(Boxplot)分析R-基团分解结果

R-基团分析的箱线图使您能够检查单个取代位置上各种R-基团的活性分布。图4显示了R5的箱线图,左起第二列显示了具有未取代氢的化合物的活性范围为5.7-8.8(其中25百分位数、中位数和75百分位数显示在方框中)。当鼠标悬停在每个单独的点上时,会弹出分子的2D结构及其活性。

Flare的R-基团分析(R-Group Analysis)-墨灵格的博客

图4. R5取代位的箱线图及其活性值范围

箱线图表明,R5处的氟甲氧基苯基取代对活性具有显著贡献。除了选择单个点外,您还可以在箱线图中指定一个矩形区域以便选择多个配体,如图5所示。

Flare的R-基团分析(R-Group Analysis)-墨灵格的博客

图5. 在主界面配体表单中用矩形区域高亮显示的分子

用热图(heatmap)分析R-基团分解结果

查看数据的另一种方法是使用按活性进行颜色编码的热图。图6是R5(水平)和 R4(垂直)的二维矩阵示例。单元格的颜色对应于RGA热图窗口顶部的颜色条,指示了两种取代基的存在对活性是积极还是消极的影响。例如,鼠标指针所在的浓郁绿色单元格有四个高中位数活性值的化合物。该单元格标识到一组具有高活性的化合物,并显示在弹出的窗口中;单击单元格可在Flare主窗口的配体表单中选中这些化合物。右下角显示的化合物是原始数据集中活性值最高的化合物,您可以轻松识别出另外具有相同的母核结构和取代模式的三个化合物,它们也具有高活性。

Flare的R-基团分析(R-Group Analysis)-墨灵格的博客

图6. 两个取代位的热图(Heat map)/矩阵(matrix)

单击矩阵顶行上的取代基结构将对列按频次以及聚合活性进行排序。图7显示了单击三个R5取代基以将包含它们的结构收集到矩阵顶部之后的部分视图。这使您可以了解活性最高化合物的任意取代基在矩阵中的稀疏程度,并帮助您随后确定不含这些有利基团的现有化合物的可能变化。图7中打勾选项标记高亮显示了添加到现有分子中有可能提高活性的基团。

Flare的R-基团分析(R-Group Analysis)-墨灵格的博客

图7. 用于查找缺失化合物的排序矩阵的一部分

结论

R-基团分析使您能够按取代基位置检查活性化合物的分布,并了解高活性所需的结构特征,这对于设计在初始药物化学设计和合成阶段可能遗漏的活性分子非常有用。在 Flare GUI中,用户只需单击几下鼠标即可轻松执行R-基团分析。

联系我们,获取试用

立即申请免费的Flare试用版,开始用R-基团分解功能来分析您自己的化合物系列!