摘要:Wang等人报道传统构象生成方法(如ConfGenX、OMEGA、RDKit)在A1O分子生物活性构象预测中完全失效,归因于方法学局限性,并建议优先采用人工智能模型。本文通过参数机制分析发现:失效主因是默认力场刻意忽略分子内长程相互作用项。具体而言,OMEGA默认力场mmff94smod_noestat排除库仑作用,Flare/XedeX默认关闭"长程静电与吸引性范德华力"选项,导致π-π堆积等关键作用未被描述。实验验证表明:当Flare启用完整非键相互作用项后,成功生成RMSD=0.96 Å的构象(精度超越文献报道的AI模型);OMEGA采用含完整静电项的mmff94smod力场亦可复现生物活性构象。本研究证实,传统方法在合理配置长程相互作用参数时,仍可高效预测强分子内作用体系的生物活性构象。该发现强调:构象生成方法的基准评测必须审慎验证力场参数设置,避免因参数配置偏差低估传统算法潜力。
肖高铿/2025-11-20
Wang等人1在评估传统方法与人工智能方法的小分子构象生成性能时发现:在数据集I(含3,354个高质量配体生物活性构象)的测试中,传统方法(包括ConfGenX、OMEGA、Conformator和RDKit ETKDG)对128个分子完全无法复现其生物活性构象。
A1O分子(图1,原文图4-B)是其中最具代表性的案例。A1O分子的晶体构象显示,其两个苯环通过π-π相互作用精确定位,这种构象在蛋白结合状态下稳定存在。然而,传统方法生成的构象未能捕捉这一特征。传统方法生成的构象中,苯环取向偏离实验确定的晶体构象,导致RMSD(均方根偏差)普遍超过2.00 Å。文章通过图1(原文图4-B)直观对比了A1O分子的晶体构象与传统方法生成构象的差异。

图1. 代表性分子A1O的生成构象与晶体构象对比。生成构象中的碳原子和晶体构象中的碳原子分别用绿色和灰色表示,所有氢原子均未显示。图片来自文献[1]。
如图1所示,传统方法生成的构象(绿色)与晶体构象(灰色)在苯环空间取向上存在显著差异,而人工智能模型生成的构象更接近实验观测状态。具体而言,传统方法倾向于生成舒展型构象,而非折叠型生物活性构象。
Wang等人1从方法学角度解释了传统方法的局限性:
- 规则库的局限性:传统方法(如OMEGA、ConfGenX)依赖从晶体数据库(如CSD或PDB)推导的构象偏好(如扭转角、环几何),但A1O分子的π-π相互作用不属于常见规则范畴,导致预测偏差。
- 能量最小化偏向:传统方法倾向于生成热力学最稳定的构象(能量最低),而生物活性构象可能因蛋白环境而处于亚稳态。A1O分子的结合构象涉及熵效应对不利的取向,传统方法的力场优化无法模拟这种蛋白诱导的构象变化。
- 采样策略不足:传统方法基于距离几何或随机采样,对于柔性分子的构象空间覆盖不全面。A1O分子需精确的扭转角组合,传统方法在有限采样下易错过关键构象。
基于此,Wang等人1推测:”对于具有强分子内相互作用的生物活性构象预测,人工智能模型可能是更优选择”
本文提出不同见解:传统方法的失效主因在于默认力场参数设置。为了平衡速度与精度,默认参数使用的变体力场通常忽略了分子内长程相互作用——这使得分子内强的相互作用被忽略。
以omega的searchFF选项为例2,3:
1 | -searchFF : Forcefield to be used for torsion driving |
该力场参数有多个选项2,3:
1 2 3 4 5 6 7 8 9 | Contents of parameter -searchFF
Aliases : -srchff
Type : omegaff
Allow list : false
Default : mmff94smod_noestat
Simple : false
Required : false
Legal values : mmff mmff_noestat mmff_trunc mmff_sheff mmff94s mmff94s_noestat mmff94s_trunc mmff94s_sheff mmff94smod mmff94smod_noestat mmff94smod_trunc mmff94smod_sheff sage sage_noestat sage_sheff
Brief : Forcefield to be used for torsion driving |
注意到:mmff94smod_noestat是searchFF选项的默认参数。根据说明书3对mmff94smod_noestat的描述,该力场变体包含除库仑相互作用之外的所有 MMFF94s-Mod 项。也就是说,在默认情况下,omega为了平衡计算速度与精度,刻意排除了分子内库仑相互作用项(即静电作用),导致长程非键相互作用被忽略.这可以解释为什么Wang等人1观察到使用传统方法不能重现A1O的生物活性构象。
Flare4的构象搜索工具Conformation Hunt(对应的命令行工具为XedeX5)是另一个采用类似策略的构象搜索方法,在默认条件下忽略分子内长程相互作用,如下图2所示。

图2. Flare构象搜索参数4
请注意,Flare 构象搜索在默认情况下”Turn off Coulombic and attractive vdW forces“选项是被选中的。这意味着:如果设置此选项,用于最小化构象的力场将关闭吸引性范德华力和库仑力。这会提高对更大、更柔性分子的采样效率(特别是更扩展的构象),但代价是削弱分子内氢键等关键相互作用的描述能力。如果知道构象受分子内氢键等关键相互作用影响很大,则需要关闭此选项,否则建议保持开启。
在实践中,除了分子内经典的氢键之外,该选项还对其它分子内相互作用产生影响,比如O/N···S相互作用、C-H···O=C等非经典氢键相互作用、卤键、π-π以及Cation-π相互作用等。在最近的一个构象搜索案例中用FieldTemplater预测ROS1抑制剂的生物活性构象6,涉及分子内N···S相互作用,强调一定要关闭”Turn off Coulombic and attractive vdW forces“项以确保得到正确的生物活性构象。在10年前更早的一个案例中,分享了共晶结构PDB 1S63的配体构象搜索案例7,发现长程相互作用选项对重现分子内Cation-π相互作用的影响。
以 Flare 构象搜索为例,在关闭”Turn off Coulombic and attractive vdW forces“选项之后,就正确地找到A1O的生物活性构象,RMSD = 0.96 Å。

图3. A1O生物活性构象(黄色)与Flare 生成构象(绿色)的比较
如上图3所示,黄色分子为PDB 4LA7共晶配体A1O的结合构象,绿色分子为Flare 搜索到的一个低能构象,两者之间的重原子RMSD = 0.96 Å,精度优于Wang等人1报道的所有人工智能方法(图1)。Omega在使用标准力场的情况下,也重现了A1O的结合构象。
综上,传统构象生成方法的表观”失效”,实质源于力场长程相互作用参数配置不当,而非方法学固有缺陷。合理调整参数可显著提升对强分子内相互作用体系的预测能力。
文献
- Wang, Z. et al. (2023) “Small-Molecule Conformer Generators: Evaluation of Traditional Methods and AI Models on High-Quality Data Sets,” Journal of Chemical Information and Modeling, 63(21). Available at: https://doi.org/10.1021/acs.jcim.3c01519.
- OMEGA 5.1.0.0: OpenEye, Cadence Molecular Sciences, Santa Fe, NM. http://www.eyesopen.com
- Omega Documnet. OpenEye, Cadence Molecular Sciences, Santa Fe, NM. https://docs.eyesopen.com/applications/omega
- Flare V10. Cresset. https://www.cresset-group.com/software/Flare
- XedTools. Cresset. https://cresset-group.com/software/xed-tools/
- 用FieldTemplater预测ROS1抑制剂的生物活性构象. 墨灵格的博客. Available at: http://blog.molcalx.com.cn/2025/10/17/prediction-of-bioactive-conformation-of-ros1-inhibitors.html
- 用XedeX进行构象搜索. 墨灵格的博客. Available at: http://blog.molcalx.com.cn/2025/11/16/conformation-search-performance-with-xedex.html