在Flare™中进行计算库枚举:利用预构建及自定义反应“合成”异双功能性分子
摘要:本文介绍了 Flare 软件中的库枚举(Library Enumeration)模块,一种基于反应规则(如 Reaction SMARTS/SMIRKS)的虚拟化合物库构建工具,广泛应用于虚拟筛选、QSAR 分析和自由能微扰(FEP)等计算化学任务。本文以合成靶向蛋白降解剂(如 10a–b 和 12a–d)为例,详细展示了如何利用 Flare 内置的 167 个化学反应及自定义 SMIRKS 规则,通过多步反应级联高效生成结构准确的异双功能分子。相比传统合成流程,该方法可跳过官能团保护/去保护步骤,在计算实验中实现“合成捷径”,最终生成的化合物可直接用于三维构象生成、分子对接或进一步结构扩展,显著提升药物设计效率。
什么是库枚举(Library enumeration)?
库枚举(Library enumeration) 是一种构建虚拟化合物库的实用工具,可用于各类计算机模拟实验,例如虚拟筛选、定量或定性构效关系(QSAR)研究,以及自由能微扰(FEP)计算。Flare 的库枚举功能1 采用基于反应的方法,即对指定的反应物施加计算层面的化学转化。该过程类似于在计算机中进行组合化学合成,其核心是基于 RDKit 方法2,3 使用 Reaction SMARTS 或 SMIRKS 表达反应规则。
借助该工具,用户可将内部试剂库上传至 Flare,生成用于筛选的化合物,并直接将所得产物用于后续的虚拟实验,如分子对接或 QSAR 分析。库枚举工具仅对符合反应编码 SMIRKS 模式的试剂执行反应,其余试剂则被自动跳过。例如,若您的全部化学库存储于单个 SDF 或 CSV 文件中,而您仅希望在 Flare 中利用其中的硼酸类化合物与另一配体进行 Suzuki 偶联反应,则程序将仅调用该文件中符合条件的硼酸,生成相应的偶联产物库。
对于结构更复杂的分子,用户还可依次排布多个反应,构建反应级联(reaction cascade),从而高效生成目标终产物。本文将通过使用预置反应与自定义反应,演示库枚举工具在“合成”用于靶向蛋白降解的异双功能分子方面的强大能力。图 1 展示了 Flare 中库枚举功能所涉及的反应拆解流程。

图1. Flare V10的库枚举(Library Enumeration)模块所包含的可用反应分类,目前共有167个反应可供使用。
异双功能分子的合成:一个示例说明
接下来,我们将以 Manda S. 等人4 报道的降解剂 10a–b 和 12a–d 的合成为例(见图示方案1)来展示库枚举功能的实用性。
图示方案1. 降解剂 10a–b 和 12a–d 的合成路线

该合成起始于市售的卤代醇,其结构中含有一个或两个聚乙二醇(PEG)单元。步骤1和2:首先用叠氮化钠取代氯原子,以叠氮基团“掩蔽”胺基;随后通过亲核芳香取代(SNAr)反应与对氟硝基苯反应,生成醚类化合物 4a–b。步骤3:将叠氮基还原为游离胺;步骤4:该胺再通过 SNAr 反应与 CRBN 结合配体 6 偶联;步骤5:硝基被还原,得到苯胺类中间体 8a–b;步骤6:这些中间体分别与不同的抑制剂 9 和 11a–b 反应,最终生成目标降解剂 10a–b 和 12a–d。
借助 Flare 当前内置的反应库,图示方案1中的整条合成路线均可通过库枚举(Library Enumeration)工具完成。然而,在步骤6中,若直接进行偶联,将步骤5生成的两种中间体与三种抑制剂进行交叉反应,会生成16种产物——因为库枚举功能无法考虑化学反应活性或空间位阻因素。为避免这些不希望出现的副反应,我们在最后一步采用了自定义的 SMIRKS 规则。

图2. 利用库枚举功能合成降解剂。在 Flare 中配置了六步反应,最终生成6种目标降解剂结构。
根据您对 SMARTS/SMIRKS 的熟悉程度,还可通过自定义反应进一步简化整个合成过程。以图3所示的第一部分为例:原本从试剂 1a–b 到中间体 8a–b 需要五步反应级联,而借助自定义反应,仅需两步简单反应即可得到中间体 8a–b。第一个自定义反应以 PEG 卤代醇(试剂1)为起始物,同时将 PEG 上的氯原子转化为含氮基团,并自动将沙利度胺配体连接至分子另一端;第二个反应则对应于原方案1中的步骤2,将对氨基苯胺连接到连接臂(linker)的末端羟基上,该羟基在 SMIRKS 中被标记为 ‘[O:1]’(见图3)。这种合成“捷径”在真实湿化学实验中几乎无法实现,但在虚拟环境中却可轻松完成。

图3. 该反应序列中的最后一个自定义反应,将配体上的特定碳原子与中间体中的特定氮原子进行反应连接。以中间体 8 与配体 11b 的反应为例进行说明。图中高亮显示了参与转化的原子,以对应 SMIRKS 反应规则中的原子映射。
如今所得结果不仅在化合物数量上准确,而且最终降解剂的连接方式也完全正确。更为便捷的是,我们无需逐个设置整个反应级联中的每一步,仅通过三个自定义反应便完成了全部合成。借助这种虚拟合成策略,我们省去了在湿化学实验中必需的官能团掩蔽与脱保护步骤。最终,从三个配体和两个卤代醇出发,成功生成了六个目标降解剂。图5 展示了这些降解剂的三维结构及其场点(field points)。其中,库枚举工具生成的二维产物已通过“Pop to 3D”工具转换为三维构象。

图4. 六个最终降解剂的三维结构及其场点
现在,这些最终降解剂现已可直接在 Flare 中用于后续的实验,例如配体叠合(ligand alignment)、分子对接(docking)或 QSAR 研究。此外,还可通过“Hit Expander”工具进一步拓展生成更多类似物,或手动编辑为全新结构。
结论
随着针对异双功能分子作为治疗手段的研究不断升温,对能够对其进行计算建模的方法需求也日益增长。库枚举(Library enumeration)技术可在计算机中“合成”大量降解剂化合物库,从而避免了手动构建虚拟结构的繁琐过程。借助 Flare 内置的 167 个反应(未来版本中还可能进一步扩充),研究人员能够轻松地从常见构砌块出发组装分子,高效生成庞大的化合物库,用于后续的各类实验研究。
作者介绍

Jessica_Plescia 应用科学家
Jessica Plescia 在加拿大蒙特利尔麦吉尔大学(McGill University)获得药物化学/有机化学博士学位。随后,她在CRO公司 Nuchem Sciences 以及全球生命科学风投机构 adMare Bioinnovations 担任研究科学家,工作两年。Jessica 在抗癌和抗阿尔茨海默病药物的药物化学研究方面具有丰富经验,同时精通计算机辅助药物设计,包括虚拟筛选、定量构效关系(QSAR)和计算机合成(in silico synthesis)。作为 Cresset 公司的应用科学家,Jessica 的职责包括为客户提供培训与技术支持,帮助他们利用 Cresset 基于配体和基于结构的软件解决方案实现科研目标。