d3dock(carp)
平台部署
172.21.85.23
- conda activate rdkit
- nohup bash /home/databank/database/d3carp/scripts/1-Docking_TP.sh -l /home/databank/ydn/d3carp-docking/workdir/test/JST181.mol2 -t /home/databank/ydn/d3carp-docking/workdir/test/allpdb -c 100 &
75.6
使用方法:
- mamba activate zyzhou
- nohup bash /home/databank/zyzhou/database/d3carp/scripts/1-Docking_VS.sh -l /home/databank/zyzhou/project/TCM_explore/ED/d3carp_vs/dock/food_herb_20251024_MW_150-800.smi -t 1udt -c 50 &
说明:
在配置环境时发现用conda安装mgltools会覆盖掉openbabel,导致程序报错
经检查后发现 mgltools 比较古老,python 是python2 而不是python3
解决方案是手动安装 1.5.6 版本的mgltools (1.5.7版本有点问题),然后在
/home/databank/zyzhou/database/d3carp/scripts/attach/VS2Dconvert3D.sh
的mgltools命令(配体准备)中指定mgltools 自己的python 程序及脚本,这样即可运行
- /home/databank/zyzhou/software/mgltools/mgltools_x86_64Linux2_1.5.6/bin/python /home/databank/zyzhou/software/mgltools/mgltools_x86_64Linux2_1.5.6/MGLToolsPckgs/AutoDockTools/Utilities24/prepare_ligand4.py -l ${vsName}.mol2 -o ${vsName}.pdbqt -A hydrogens
安装方法:
miniforge
- mamba create -n zyzhou python=3.10 -y
- mamba activate zyzhou
rdkit
- mamba install rdkit
openbabel
- mamba install openbabel
vina
- mamba install vina
mgtools
- 75.6 /home/databank/zyzhou/software/mgltools/mgltools_x86_64Linux2_1.5.6
解压后进入文件夹
- ./install.sh
会跳图形化界面,关闭即可,不影响使用
由于mgltools python版本与现在的大多数软件不兼容,建议直接用绝对路径调用相关程序
对接模型补充
石禹龙师兄d3carp论文 D3CARP: a comprehensive platform with multiple-conformation based docking, ligand similarity search and deep learning approaches for target prediction and virtual screening - ScienceDirect 里说明了对接模型源自2020版PDBbind-CN数据库。其中complex的配体redock能够较好复现(docking score < −5 kcal/mol and the RMSD <2 Å)的对接模型成为D3CARP的中的对接模型。
蛋白准备软件根据石禹龙师兄d3carp论文,使用 ADFRsuite version 1.0 Downloads – ADFR 进行准备
软件安装:
- 75.6 /home/databank/zyzhou/software/ADFRsuite
将下载得到的 ADFRsuite_Linux-x86_64_1.0_install 上传服务器
- chmod a+x ADFRsuite_Linux-x86_64_1.0_install
- ./ADFRsuite_Linux-x86_64_1.0_install
会让你选择安装路径,这里,选择的是
- /home/databank/zyzhou/software/ADFRsuite/install
- cd install
- tar -zxvf ADFRsuite_x86_64Linux_1.0.tar.gz
- cd ADFRsuite_x86_64Linux_1.0
- mkdir build
- ./install.sh -d build
安装完成
调用方法:
- export PATH=/home/databank/zyzhou/software/ADFRsuite/install/ADFRsuite_x86_64Linux_1.0/build/bin:$PATH
补充对接
- 从pdb上下载靶点结构(尽可能是复合物结构)
- 用薛定谔等软件对蛋白进行补链,优化(prewizard全流程)
- pymol 里导入薛定谔优化过的蛋白结构,将对接模型所需的链另存为pdb
- 下载配体结构(PDB mol2)或者 pymol 里导入薛定谔优化过的蛋白结构,将配体另存为mol2
- 用脚本批量进行蛋白,配体格式转换及对接参数生成,redock
蛋白格式转换使用 龙师兄的脚本中的命令
- 85.13 /home/zjxu/ylshi/RAFT/Docking/scripts/process/protein-pdbqt.sh
- 85.13 /home/zjxu/ylshi/RAFT/Docking/scripts/process/ligand-pdbqt.sh
以下为之前wwxd 补充对接的原始记录,待整理
脚本思路
- # /home/zjxu/zzy/people/lbh/wwxd-2024-11/d3carp-update/self-defined-database
- # 1-prepare-file-from-pdb.sh
- # 基于从pdb上下载的复合物结构,进行受体,配体准备,盒子生成,配体重对接
- # 步骤如下:
- 1.PDB上下载复合物晶体结构,pymol里进行清洗:只保留一条链,删掉所有配体,去水,另存为一个pdb文件(命名不变),上传 'pdb' 文件夹;
- 2.PDB上下载上一步保留的那条链的配体(mol2格式,命名不变),上传'pdb' 文件夹;
- 3.运行 1-prepare-file-from-pdb.sh
对接
- # /home/zjxu/zzy/people/lbh/wwxd-2024-11/d3carp-update/workdir
- # self-rec.list 里是补充对接的PDBID,小写
- sh multi-mols-d3carp-TP.sh
- # d3carp-TP-custom_rec.sh 文件是在 D3CARP的 1-Docking_TP.sh 基础上改的,其中vina调用的都是我自己准备的蛋白,口袋参数
- # 分析脚本做了小修改,potency这种没信息的都注释掉了
- # 得到的文件格式和D3CARP的完全一致
结果处理,可视化
- # 24 /home/databank/zzy/people/lbh/wwxd-2024-11/EA-dock
- # 把补充对接的结果复制过来
- scp -r zjxu@172.21.85.13:/home/zjxu/zzy/people/lbh/wwxd-2024-11/d3carp-update/workdir/result ./supplementary_docking
- # 要把第一行删了,后面cat就不会引入标题行信息造成混乱了
- sed -i '1d' ../../supplementary_docking/WXD-04/WXD-04_analysis.txt
- # /home/databank/zzy/people/lbh/wwxd-2024-11/EA-dock/d3carp-85.13/draw
- # index 里要写D3CARP本身的蛋白id 和 补充的id
- # mol 就是输入要对接的配体
- # d3carp-supplementary_docking-clean.sh 会把d3carp和补充对接结果一起整理,最后输出 d3carp-dock-result-clean-v2.txt
- # 其中补充对接的几个蛋白靶点名称信息需要手动补充(原来是NONE)
- # 这次补充的较少,就偷懒了,简单记录下需要后续优化的地方:
- 1. 一开始,批量获取复合物结构;
- 2. 获取 配体名称,活性等信息
