摘要:在Spark中对新生成的骨架进行聚类可以让您能够根据化学类型对化合物进行分组。这样可以轻松识别分子模式,显示出哪些化合物与参比分子最匹配。SPARK里有几个选项可供选用,本文以PDB 1OTY共晶配体的骨架跃迁结果为例,简要地讨论了化合物聚类时的一些关键技术和实践中需要考虑的因素。
作者:Scott Midgley†/2022-08-15
单位:†Cresset, New Cambridge House, Bassingbourn Road, Litlington, Cambridgeshire, SG8 0SS, UK
编译:肖高铿
前言
Spark是计算生物等排体替换的成熟软件解决方案。事实上,我们的客户告诉我们,这是他们用过的最好的骨架跃迁工具!Spark使用Cresset专有的XED力场来评估分子片段与已知参比的相似性,从而可以在几分钟内生成数百个新的分子设计。 大量新化合物的产生对药物化学家提出了挑战,他们必须快速评估,然后从这种实验产生的数据中收集见解。
在Spark中对新生成的骨架进行聚类可以让您能够根据化学类型对化合物进行分组。这样可以轻松识别分子模式,显示出哪些化合物与参比分子最匹配。SPARK里有几个选项可供选用,本文简要地讨论了化合物聚类时的一些关键技术和实践中需要考虑的因素。
在以下算例中,Spark用于寻找PDB 1OIT(一种细胞周期依赖性激酶)共晶配体的生物等排体。每个新生成的分子都有一个打分值显示在聚类结果表单的“Score”列中。
聚类算法可通过Project菜单里的Clustering Algorithm子菜单来轻松调整,然后选择Normal Clustering、Scaffold Clustering、Substituent Clustering、Scaffold-Substituent Clustering中的一个即可。
打分最高的化合物被定义为所在类的“代表”。当多个化合物被分配到同一个类时,则该类的“NC”列显示的化合物数量将大于1。在图1中可以清楚地看到更改聚类算法的效果,因为每个类别的化合物数量都发生了显著的变化(以橙色圈出)。
图 1. Spark聚类结果表单,分组的依据分别为 a) 标准聚类、b) 骨架聚类、c) 取代基聚类、d) 骨架-取代基聚类。
标准聚类(Normal Clustering)
如果连接的原子之间的路径相同,包括沿着路径的环中的所有原子,则标准聚类方法将这样的化合物分在同一簇中。沿着相同2D结构上有不同的杂原子,则是不同的路径,这意味着(-CH2CH-)与(-CH2NH-)聚类归属不同,尽管结构相似。
骨架聚类(Scaffold Clustering)
骨架聚类方法使用与标准聚类方法相同的2D结构方法,但是所有元素都转换为碳。这保留了标准聚类方法的2D 结构分类,但是该方法对杂原子的存在不敏感。这通常会产生比标准聚类方法更大的簇,如图1所示。图1还显示了用于化合物聚类的骨架。图1a和1b中“Clustering”列的比较表明,尽管标准聚类和骨架聚类具有相同的母核骨架形状,但在骨架聚类中不存在杂原子。这里有一个算例说明了一个分子如何被骨架聚类与标准聚类算法归属为不同的簇:在图1a(标准聚类)中该化合物作为单个分子簇排名第6,在图1b(骨架聚类)中该化合物作为排名第2簇的一个成员。
取代基聚类(Substituent Clustering)
取代基聚类方法的工作原理与标准聚类方法类似,但是这种方法对环的取代很敏感。因此,根据标准聚类方法,对位或间位取代的苄基 (-CH2-Ph)属于同一个簇;但根据取代基聚类方法,则属于不同的簇。取代基聚类方法对取代基种类敏感,这意味着对位Ph-Cl与对位Ph-Br归属于不同的簇。从图1a和1c可以看到,标准聚类的前三个化合物在取代基聚类属于同一个簇,因为环取代基没有差异。比较图1a和1c,可以发现排序第4的簇尽管具有相同的代表性化合物,但成员分子的数量不同。这是因为标准聚类方法不比较环上的取代基,这可以在“Cluster”列中显示的母核骨架的视觉比较看到。在取代基聚类中有个甲基连接到母核骨架的五元环上,在标准聚类方法里的一个化合物被排除在取代聚类之外。
骨架-取代基聚类(Scaffold-Substituent Clustering)
最后,骨架-取代基聚类方法将前述的两种聚类方法结合在一起,在对环取代基位置聚类之前将所有元素都转化为碳,这意味着该方法对环取代的位置敏感,但对取代基种类不敏感。比较图1中排序第4的簇,可以发现不同方法之间的差异。图1d显示了用于骨架-取代基聚类的母核骨架。图1d表明,尽管五元环上具有环取代基,但与图1a相比,没有杂原子存在,结合了图1b和1c的变化。