摘要:本教程以常见的化合物物理性质计算为例,演示了如何建立KNIME工作流,实现下面的操作:读入一个SDF格式化合物数据库,进行脱盐处理,计算性质(氢键受体、供体数量,油水分配系数,极性表面积,可选择键数量,分子量),性质过滤,输出结果到一个SDF格式文件。

一. 前言

KNIME是一款开源的数据处理与分析平台,尤其在化学与药物设计领域,可以用KNIME来完成很多繁琐、重复的任务。比如经常需要对化合物数据库做很多必要的处理:脱盐,加氢,生成3D结构,结构优化,构象搜索,性质计算,结构格式转化等等。所有的这些都可以通过建立一个KNIME工作流(Workflow)来实现。

使用KNIME最大的好处是:1)不需要编程就可以进行灵活的数据处理与计算;2)如果数据有更新,只是重新运行工作流即可完成;3)有利于团队技术传承:一个专业高手写个工作流保存下来,可以分享给非专业的同事使用而免去重复开发、降低学习成本。

二. 应用实例

本教程以常见的化合物物理性质计算为例,包含了下面的操作步骤:读入一个SDF格式化合物数据库,进行脱盐处理,计算性质(氢键受体、供体数量,油水分配系数,极性表面积,可选择键数量,分子量),性质过滤,输出结果到一个SDF格式文件。整个流程写成图1的工作流。
KNIME workflow

图 1. KNIME工作流:化合物的性质计算与过滤

实例下载:http://blog.molcalx.com.cn/prop_demo.zip

实例的运行:请将实例下载,导入到KNIME即可 (见下图2)。

KNIME工作流的导入

图 2. KNIME工作流的导入

三. 说明

本文的目的是提供一个实例用来学习如何使用KNIME进行计算。在实际工作中请根据实际需求对数据进行合适的处理,但是我相信这足够让您了解如何使用KNIME的对化合物进行计算。

四. 更多应用

  1. 靶标预测
  2. 使用Ligandscout来进行基于药效团的靶标预测:http://www.molcalx.com.cn/ligandscout

    Ligandscout Activity Profiling

    图 2. KNIME工作流:基于药效团的靶标预测(作用谱分析)

    Activity sample

    图 3.靶标预测生成的报告样稿

  3. 分子对接
  4. 实现PDB晶体结构下载,定义结合位点,读入配体,跑一个AutoDock Vina分子对接计算。

  5. 3D-QSAR
  6. 药效团生成与虚拟筛选等等
  7. 生物活性数据获取