AutoT&T 2.0算例 | VEGFR-2抑制剂的多起点优化

摘要：VEGFR-2是非常重要的抗肿瘤靶标，本文以结构多样的12个VEGFR-2抑制剂做为多起点优化的参比分子，演示了AutoT&T 2的多起点优化算法的使用场景、方法与性能。包括参比分子的准备，多起点优化，PLP打分与结构聚类分析等操作步骤。

1. 背景

某些靶标通常会有多个已知的活性化合物、候选化合物、甚至有上市药物报道，在先导物优化的过程中充分利用这些已知活性化合物的信息是非常有用的。利用这个已有活性化合物的方法之一是将构成这些已知活性化合物的不同片段交叉“糅杂”，药物化学领域常用这种方法获得活性更高的化合物或者绕开专利保护。我们把这种方法称为多起点优化（Multithread Optimization），AutoT&T 2可以全自动的完成此类设计。除了AutoT&T 2之外，MOE的BREED也具有类似的功能，因此我们还将AutoT&T 2与BREED进行了性能比较。

Li Yan(2016)等人报道了VEGFR-2抑制剂的多起点优化算例¹。VEGFR-2是非常重要的抗肿瘤靶标，在DrugBank（Version 4）与PDBbind（Version 2014）共收录有36个抑制剂，其中包括上市药物与候选化合物。去除冗余结构后获得结构多样的12个化合物（表 1）做为多起点优化的参比分子。本文通过总结Li Yan（2016）的算例以演示AutoT&T 2的多起点优化算法的使用场景、方法与性能。

表 1. 12个VEGFR-2抑制剂


Linifanib\|DB06080	Ponatinib\|DB08901

Sorafenib\|DB00398\|IC₅₀=7nM	Sunitinib\|DB01268\|K_d=1.5nM

DB06938\|PDB:2QU5\|K_i=8.7nM	CHEMBL2332847\|IC₅₀=83nM

DB07333\|PDB:1Y6B\|IC₅₀=38nM	Vandetanib\|DB05294

DB07528\|PDB:3CPC\|IC₅₀=5μM	DB08519

DB07537\|PDB:3CPB\|IC₅₀=25μM	DB07183\|PDB:2P2I\|IC₅₀=38nM

2. 多起点优化生成新的结构

2.1 参比分子的准备

Li Yan等人(2016)¹用分子对接计算来准备参比分子。VEGFR-2的靶标蛋白3D结构从PDB数据库下载（PDB code：1YWN），用GOLD软件将12个参比分子对接到结合位点。每个化合物保留打分最高的5个pose，最后共得到60个对接好的分子结构作为AutoT&T 2与BREED的输入文件（即参比分子数据库）。该数据集可以在AutoT&T 2.0软件包安装目录下的example/VEGFR2目录下获取。其中mlead.mol2是docking的计算结果，1ywn_protein.pdb是docking计算用的蛋白结构。

2.2 AutoT&T 2多起点优化

多起点优化计算键入如下命令：

1	LeadOpt2 -L mlead.mol2 -p 1ywn_protein.pdb -vs mlead.mol2 -o cross_3rd.mol2 -r -i 3

其中:

L：是指需要被优化的先导化合物,上述例子是mlead.mol2。
vs：是指分子对接虚拟筛选的结果，上述例子里是mlead.mol2。
r：是在多起点优化时采用逆合成分析化学键(Optimization based on RECAP bond)，以便生成的化合物具有合理的合成可行性。
i：是指定迭代次数，在本例中进行3轮迭代。
o：用来说明输出文件的名称，这里是cross_3rd.mol2。

Li Yan等人(2016)¹还将准备好的参比分子mlead.mol2提供给MOE/BREED进行计算，将每一次的计算结果做为下一轮的初始分子，总共进行了3轮计算。

2.3 PLP打分与排序

AutoT&T 2.0自带打分函数PLP，命令如下：

1	Score -l cross_3rd.mol2 -p 1ywn_protein.pdb -o score.log -s

其中选项s的意思是用打分值对化合物进行排序。Score命令可以单独使用，PLP打分函数在系统测试中表现出良好的排序性能^2,3。

2.4 分子骨架分析与聚类

AutoT&T 2还包含有分子聚类分析模块，可以单独使用。在本研究中用来分析AutoT&T生成结构的骨架类型，命令如下：

1	Cluster -i cross_3rd.mol2 -o clust.log -ap -sca 0.5

3. 结果

3.1 AutoT&T 2比BREED生成更多的新分子数、结构也更多样

用于参比分子数据库准备用的蛋白结构用于结构生成，AutoT&T 2的LeadOpt模块对参比分子数据库自动裁剪与移植最后生成新的结构，总进行3轮优化，CPU时间20秒完成计算，共获得174个化合物。BREED不能自动进行多起点优化，需要手动将第1轮生成的结构做为第2轮的初始分子进行下一轮计算，如此反复3次。BREED在第一轮生成30个新的结构，在第2轮生成6个新结构，在第3轮没有新结构生成。除去BREED对输入与输出的操作时间，BREED用于生成结构的时间为16s，因此AutoT&T 2与BREED计算所需的时间相当。表 2总结了AutoT&T 2与BREED的异同。

表 2. AutoT&T 2比BREED生成更多的新分子数、结构也更多样

软件	新结构数量	CPU时间（s）	完成方式
AutoT&T 2	174	20	全自动
BREED	36	16	手动

虽然AutoT&T 2与BREED用了同样的输入文件、算法也相似，但是AutoT&T2比BREED生成结构更多样、数量更多的新化合物，两款软件具有及其显著的差异、获得截然不同的结果。

3.2 AutoT&T 2比BREED生成质量更好的结构

我们仅对结合亲和力更好的化合物感兴趣，结合亲和力用AutoT&T 2里的PLP打分函数进行预估。以Sorafenib（见表1）的5个POSE打分均值（~100）为准，将打分大于100的化合物做为有潜力的化合物挑出进一步进行分析。结果发现，AutoT&T 2生成174个化合物里有131个（75%）化合物的PLP打分值优于100，而BREED生成的36个化合物里有18个（50%）打分值优于100，AutoT&T 2比BREED有更大比例的化合物具有打分满意的化合物(表 3）。图 1展示了AutoT&T 2生成的PLP大于100的131个化合物在结合位点里的叠合效果图。

图 1. AutoT&T 2在将结合位点里生成了131个打分优于100的化合物，图为这131个化合物的叠合效果

表 3. AutoT&T 2比BREED生成化合物具有更高的质量

软件	新结构数量	PLP打分优于100的化合物比例	骨架数量	合成可行性（=100%）的化合物数
AutoT&T 2	174	75%（131）	47	131(75%)
BREED	36	50%（18）	15	25（69%）

对PLP打分大于100的化合物进行骨架聚类，发现AutoT&T 2生成的131个结构来源自47种不同的化合物骨架，表 4给出每一类打分最高的代表性化合物；而BREED生成的18个化合物来源自15种不同的骨架,表 5给出每一类打分最高的代表性化合物。比较两组化合物，会发现AutoT&T 2生成的47种化合物骨架包含了BREED生成的15种骨架类型。PLP打分结果也表明，AutoT&T 2生成的化合物其打分值也要优于BREED生成的结构。将两组结构用MOE的合成可行性进行打分，打分值在0-100%之间：100代表着最佳的合成可行性，0则刚好相反。AutoT&T 2生成的结构里有75%的化合物合成可行性打分为100%，而BREED生成的结构里有69%的化合物合成可行性打分为100%（表3），这说明AutoT&T 2生成的化合物比BREED生成的化合物具有更好的合成可行性。

表 4. Auto&T 2生成的47个代表性化合物

表 5. BREED生成的15个代表性化合物

3.3 AutoT&T 2与BREED都生成了参比分子之外已知的VEGFR-2抑制剂

AutoT&T 2与BREED都设计出图 2化合物，一个已知的抑制剂的VEGFR-2抑制剂，在MV4-11细胞系上测试的IC₅₀=4nM, 与Sorafenib的活性差不多（IC₅₀=7nM）。

图 2. 一个已知的VEGFR-2抑制剂化学结构式

图 3是该新化合物与VEGFR-2的相互结合模式(AutoT&T 2.0生成的pose)。

图 3. 新设计化合物与VEGFR-2的结合模式

4. 小结

本算例利用VEGFR-2抑制剂演示了AutoT&T 2.0多起点优化的应用场景、使用方法与效果。本算例从12个已知的VEGFR-2出发，首先将这些化合物对接到蛋白结构里，然后用AutoT&T 2进行多起点优化计算（先将已知活性化合物的打碎、再重组成新化合物），并与BREED方法比较，结果表明：

比传统的BREED方式，AutoT&T 2生成了更多的新化合物；
比起传统的BREED方式，AutoT&T 2生成了更多的结构类型、具有更好的结合亲和力、具有更好的合成可行性；
两者都生成了已知的VEGFR-2抑制剂

既然打分高的化合物里包含了起始化合物之外的高活性化合物，那么其它打分高的化合物也可能具有高生物学活性，值得进一步关注、合成并进行生物活性验证。

总的来说，AutoT&T 2比传统的BREED具有更好的多起点优化性能，可以满足药物化学科研人员将多个已知活性化合物的不同片段“糅杂”在一起高效获得先导化合物的目的。

5. 文献

Li, Y.; Zhao, Z.; Liu, Z.; Su, M.; Wang, R. AutoT&T v.2: An Efficient and Versatile Tool for Lead Structure Generation and Optimization. J. Chem. Inf. Model. 2016, 56 (2), 435–453.DOI:10.1021/acs.jcim.5b00691
Cheng, T.; Li, X.; Li, Y.; Liu, Z.; Wang, R. Comparative Assessment of Scoring Functions on a Diverse Test Set. J. Chem. Inf. Model. 2009, 49 (4), 1079–1093.DOI:10.1021/ci9000053
Li, Y.; Han, L.; Liu, Z.; Wang, R. Comparative Assessment of Scoring Functions on an Updated Benchmark: 2. Evaluation Methods and General Results. J. Chem. Inf. Model. 2014, 54 (6), 1717–1736.DOI:10.1021/ci500081m

6. 联系我们

AutoT&T软件由中国科学院上海有机化学研究所王任小研究员课题组开发并具有自主知识产权，广州市墨灵格信息科技有限公司作为合作伙伴提供销售与技术服务，为国内学术和商业客户提供价格优惠的永久软件使用授权。


Linifanib\|DB06080	Ponatinib\|DB08901

Sorafenib\|DB00398\|IC₅₀=7nM	Sunitinib\|DB01268\|K_d=1.5nM

DB06938\|PDB:2QU5\|K_i=8.7nM	CHEMBL2332847\|IC₅₀=83nM

DB07333\|PDB:1Y6B\|IC₅₀=38nM	Vandetanib\|DB05294

DB07528\|PDB:3CPC\|IC₅₀=5μM	DB08519

DB07537\|PDB:3CPB\|IC₅₀=25μM	DB07183\|PDB:2P2I\|IC₅₀=38nM

AutoT&T 2.0算例 | VEGFR-2抑制剂的多起点优化

1. 背景