摘要:本教程以常见的化合物物理性质计算为例,演示了如何建立KNIME工作流,实现下面的操作:读入一个SDF格式化合物数据库,进行脱盐处理,计算性质(氢键受体、供体数量,油水分配系数,极性表面积,可选择键数量,分子量),性质过滤,输出结果到一个SDF格式文件。
一. 前言
KNIME是一款开源的数据处理与分析平台,尤其在化学与药物设计领域,可以用KNIME来完成很多繁琐、重复的任务。比如经常需要对化合物数据库做很多必要的处理:脱盐,加氢,生成3D结构,结构优化,构象搜索,性质计算,结构格式转化等等。所有的这些都可以通过建立一个KNIME工作流(Workflow)来实现。
使用KNIME最大的好处是:1)不需要编程就可以进行灵活的数据处理与计算;2)如果数据有更新,只是重新运行工作流即可完成;3)有利于团队技术传承:一个专业高手写个工作流保存下来,可以分享给非专业的同事使用而免去重复开发、降低学习成本。
二. 应用实例
本教程以常见的化合物物理性质计算为例,包含了下面的操作步骤:读入一个SDF格式化合物数据库,进行脱盐处理,计算性质(氢键受体、供体数量,油水分配系数,极性表面积,可选择键数量,分子量),性质过滤,输出结果到一个SDF格式文件。整个流程写成图1的工作流。
图 1. KNIME工作流:化合物的性质计算与过滤
实例下载:http://blog.molcalx.com.cn/prop_demo.zip
实例的运行:请将实例下载,导入到KNIME即可 (见下图2)。
图 2. KNIME工作流的导入
三. 说明
本文的目的是提供一个实例用来学习如何使用KNIME进行计算。在实际工作中请根据实际需求对数据进行合适的处理,但是我相信这足够让您了解如何使用KNIME的对化合物进行计算。
四. 更多应用
- 靶标预测
- 分子对接
- 3D-QSAR
- 药效团生成与虚拟筛选等等
- 生物活性数据获取
使用Ligandscout来进行基于药效团的靶标预测:http://www.molcalx.com.cn/ligandscout
图 2. KNIME工作流:基于药效团的靶标预测(作用谱分析)
图 3.靶标预测生成的报告样稿
实现PDB晶体结构下载,定义结合位点,读入配体,跑一个AutoDock Vina分子对接计算。