摘要:本文预告了新版Forge V10.6的一些特性,包括:1)基于机器学习的3D-QSAR建模方法;2)小数据集的定性SAR分析;3)对大项目响应更快的图形界面;4)改进了Blaze虚拟筛选的接口

作者:Giovanna Tedesco
原文:https://www.cresset-group.com/2018/12/sneak-peek-forge-10-6

虽然我们的开发团队还正忙着为Forge V10.6做最后的修改,但是我们已经迫不及待地预告一下新版本的一些新功能。

1. 引进更多建模方法提高预测能力

Forge的用户告诉我们:具有强预测能力的QSAR模型的开发仍然是项目的痛点。毫不奇怪,这就是我们在此版本中专注于模型构建的原因。

在新版的Forge(V10.6)中增加了一整套众所周知且功能强大的机器学习(Machine learning, ML)方法,包括支持向量机(Support Vector Machines)、关联向量机(Relevance Vector Machines)、随机森林(Random Forests)与kNN分类,这些方法与之前的版本的Field QSAR和kNN回归形成互补。

这些机器学习方法可用于构建回归和分类模型,新版的QSAR界面也为此进行了重新设计以便提供回归与分类这两类模型的可视化和统计学信息的展示(Figure 1)。虽然每个回归和分类模型都可以单独构建,但Forge可以选择自动运行所有的机器学习模型并为您挑选最佳模型。

支持向量机回归与支持向量机分类

Figure 1. 左:观测值VS预测值. 预测值为支持向量机回归模型预测而得。右:支持向量机分类模型的混淆矩阵与统计学结果

2. 小数据集的定性分析

Activity Atlas是一种定性方法,用于将一系列化合物的SAR概括在一张3D等值图里,可用于指导新分子的设计。 Forge V10.6包含了新的活性悬崖计算方法,通过略微缩小最强活性悬崖的重要性来生成更详细的SAR等值图。

Activity Atlas

Figure 2. Activity Atlas将构效关系浓缩于一张图

您可能希望使用该方法的来理解中、小型数据集的SAR,因为这种方法比以往的方法提供更加精细的细节信息。 对于较大的数据集(例如,为了快速了解专利文献的SAR信息),原先算法将帮助您专注于普遍的SAR信息。

3. 新版的图形界面对大的项目响应更好

对于超过1000个分子、有多种叠合方式和QSAR模型的大型项目,Forge V10.6比起以往的版本将更加高效、响应更好而不会卡顿。 在新版的Forge里,您将看到常见操作性能的改进,例如过滤器、自定义图的计算与交互以及导出数据等等。 Activity Miner和Activity Atlas中大型相似性矩阵的计算也将更快、更强大并且使用更少的内存。此外,新版的Forge将取消16个CPU核心的限制,而支持使用本地所有的CPU进行计算(如果你的CPU支持的话)。

Forge支持本地多核心并行

Figure 3. Forge支持多核心并行计算

4. 改进了Blaze虚拟筛选接口

Blaze虚拟筛选的结果展示有了改进,可以绘制每次Blaze优化的富集图与统计学指标。

改进的Blaze图形界面

Figure 4. Forge中Blaze虚拟筛选接口.

5. 联系我们

订阅Cresset新闻、关注产品信息。或者填写下表联系我们测试Forge,1个月免费测试。