12.19-26 MD pre (3CL)

蛋白准备

整理了一下13个化合物打分,发现打分最高的3CL受体是 3C_like_proteinase+Dimer+6Y2G,PL是 Papain-like_proteinase+Trimer+6W9C
12月初,对原花青素与白桦脂酸进行了CMD 模拟。当时用的受体如下图所示
本次重新准备,全部选用晶体结构-D3Docking的原始pdb文件-pdb2pqr
  • 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/pro/pdb2pqr
  • pdb2pqr30  ../d3dock-result-pdb/3C_like_proteinase+Dimer+6Y2G.pdb 3C_like_proteinase+Dimer+6Y2G.pqr  --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output 3cl-dimer.pdb
  • pdb2pqr30  ../d3dock-result-pdb/Papain-like_proteinase+Trimer+6W9C.pdb Papain-like_proteinase+Trimer+6W9C.pqr  --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output pl-trimer.pdb
3CL与PL分开准备
  • 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol
  • 85.23 /home/databank_70t/zzy/project/hsbd/2024-pl-13mol

生成配体参数

CAS-mol

  1. 检查CAS号,与PMS系统中的依次对照,确保一致;
  2. puchem根据 CAS号下载3D结构(sdf),注意这个3D结构也不是特别靠谱PubChem3D - PubChem
  3. 对下载的sdf进行检查,将名字改为CAS号
  4. schrodinger2017 ligprep 
  5. ligprep结果上传 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/ligand

高斯优化

472-15-1与20347-71-1前期优化过了
以下操作适用于其余11个配体
其中 51059-44-0 与 85999-40-2 带一个负电(羧基),其余都是中性
  • 2. 使用antechamber生成配体小分子参数(85.23)
  • # /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep

  • # !!!!!!!!!!记得挨个检查电荷哇!!!!!!!
  • for i in `cat index`;do mkdir $i;cd $i;antechamber -i ../../../ligand/${i}.sdf -fi sdf -o $i.gjf -fo gcrt;sed -i '1,3d' $i.gjf;sed -i '1i %mem=4GB\n%nproc=4\n#B3LYP/6-31G* Pop=MK iop(6/33=2) iop(6/42=6) opt' $i.gjf;cd ../;done

  • # 修改 51059-44-0 与 85999-40-2 电荷为-1
  • # 提交 高斯优化任务
  • [1]   Running    nohup g16 13040-46-5.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/13040-46-5)
  • [2]   Running    nohup g16 1486-70-0.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/1486-70-0)
  • [3]   Running    nohup g16 20633-67-4.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/20633-67-4)
  • [4]   Running    nohup g16 51059-44-0.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/51059-44-0)
  • [5]   Running    nohup g16 53846-50-7.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/53846-50-7)
  • [6]   Running    nohup g16 56083-03-5.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/56083-03-5)
  • [7]   Running    nohup g16 59870-65-4.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/59870-65-4)
  • [8]   Running    nohup g16 78574-94-4.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/78574-94-4)
  • [9]   Running    nohup g16 8049-97-6.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/8049-97-6)
  • [10]-  Running    nohup g16 85999-40-2.gjf &  (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/85999-40-2)
  • [11]+  Running    nohup g16 91433-17-9.gjf &
  • for i in `cat index`;do cd $i;antechamber -i $i.log -fi gout -o $i.prep -fo prepi -c resp;parmchk2 -i $i.prep -f prepi -o $i.frcmod -a y;cd ../;done

复合物体系准备

复合物初始构象的坐标就采用D3Docking的对接结果

gv-check

  • # 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/gv
  • for i in `cat ../index`;do cp ../ligprep/${i}/NEWPDB.PDB rawg16-${i}.pdb;done
  • for i in {1..13};do a=`sed -n "${i}p" tcmid-cas|awk '{print $1}'`;b=`sed -n "${i}p" tcmid-cas|awk '{print $2}'`;cp /home/databank_70t/zzy/project/hsbd/D3Targets-dock/workdir/3cl-pl-real-allconf-best-pkt/md-conf/3C_like_proteinase+Dimer+6Y2G/$a/*sdf ./d3dock-${b}.sdf;done

  • # 本地 gv
  • # gv里分别打开 NEWPDB.PDB(rawg16-${i}.pdb) 与 d3dock-${i}.sdf
  • 打开GV tools-atom list-鼠标点击symbol列-rows-sort selected -拖动鼠标选择所有H-edit-delete-selected atoms),接着仍在atom list中,edit-z matrix-standardize,保存。
  • 得到 g16-gv-${i}.pdb dock-${i}-gv.pdb

  • # GV里 检查 g16-gv-${i}.pdb 与 dock-${i}-gv.pdb,更改 dock-${i}-gv.pdb (atom list - Tag),使其Tag 与g16-gv.pdb 完全一致,修改后得到 dock-${i}-gv-checked.pdb

  • # /home/databank_70t/zzy/people/samuel/20241016-t13-5mol-cmd/sys-pre/gv-check
  • dos2unix *
  • sh gv-check-lig.sh

  • #### "gv-check-lig.sh" 6L, 207C #############################################################
  • for i in `cat index`
  • do
  • grep -v "CONECT" g16-gv-${i}.pdb |cut -b 1-26 > symbol-${i}
  • grep -v "CONECT" dock-${i}-gv-checked.pdb | cut -b 29-78 > coordinate-${i}
  • paste -d " " symbol-${i} coordinate-${i} > lig-${i}.pdb
  • done
  • #############################################################################################

tleap

  • # /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/tleap
  • # 23上原本是默认的amber18的tleap,其中无ff19sb力场,需要通过tleap -I 调用conda ambertools下的环境,实操中,会因为有默认的amber18路径,加载参数有Warning,故新建了一个不默认调用amber18的环境 ~/zzy/ff19sb.sh (复制 ~/.bashrc 仅修改了amber18字段)
  • ##########################################################################################
  • # zyzhou 20241020 remove amber18 and add conda ambertools to source ff19sb
  • export PATH=/home/dddc/anaconda3/envs/ambertools/bin:$PATH
  • #source /home/dddc/software/amber18/amber.sh
  • export LD_LIBRARY_PATH=/home/dddc/anaconda3/envs/ambertools/lib:${LD_LIBRARY_PATH}
  • ##########################################################################################
  • # 加载环境
  • source ~/zzy/ff19sb.sh
  • # 自动化流程 tleap
  • nohup sh tleap.sh

  • # tleap.sh 的具体代码可在工作路径查看
  • # 有几个注意点

  • 1. tleap.in 最后写个quit,可丝滑推出tleap;
  • 2. make_ndx 需要使用 (echo '1|13'; echo 'q') | gmx_mpi make_ndx -f gromacs.gro -o index.ndx 来确保选中了 1|13
  • 3. 本次13个化合物里,472-15-1;51059-44-0;85999-40-2三个是带1个负电荷的,tleap.in指定加了9个钠离子,其他的10个化合物都是加8个钠离子就够了

  • 4. 本实验中蛋白为二聚体,这种情况下,tleap.sh无法一步到位:蛋白会有system1,system2。他们的itp得分开写。这个时候,每个system里有多少原子要到 [ atoms ]里面去看,这个system的最后一个原子是多少。本次实验中(2024-12-26)该部分内容的操作记录如下,有时间要想办法流程化。
  • # 85.23 作为备份,没修改,直接在预平衡的工作服务器-85.2 上做了修改
  • # 85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/sys-pre/tleap 
  • # 原来给配体的那个itp 得改成posre3
  • sed -i 's/posre2/posre3/g' */gmx/topol.top
  • for i in `cat ../index`;do mv $i/gmx/posre2.itp $i/gmx/posre3.itp;done
  • # 每个体系蛋白两条链是一样的,所以统一制作posre1.itp posre2.itp
  • # top的[ atoms ]里面去看,system1是4608,system2是4613,加起来和protein 这个组(9239)相等
  • # 85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/sys-pre/tleap/itp 手动改一下

  • # 注意!每个top文件插入的位置不同,写了个小脚本进行了文本插入
  • ####################### "do.sh" 7L, 267B ##################################################
  • for i in `cat ../index`
  • do
  • cd $i/ gmx
  • protein_itp_site=$(grep -n -B3 "system2" topol.top | head -n 1 | awk -F '-' '{print $1}')
  • sed -i "${protein_itp_site} a ; Include Position restraint file\n#ifdef  POSRES\n#include \"posre1.itp\"\n#endif" topol.top
  • cd ../../
  • done
  • ###########################################################################################

  • # 最后,对得到的体系进行检查
  • # 检查电荷
  • grep unperturbed */leap.log
  • !!!!将com-dry.pdb下载下来检查!!!!

体系平衡

  • # 172.21.85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal
  • # min-nvt-npt.sh 在mdp文件合适的情况下仅需要修改工作路径,就可以自动完成所有体系的预平衡
  • # mdp文件
  • scp dddc@172.21.75.1:/home/data/zzy/project/hsbd/pre-bal/* ./

  • dddc@gpu2:~/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal$ nohup bash min-nvt-npt.sh &
  • [1] 2657894

200ns模拟记录

2024-12-26 17:45 仅有3090与GPU4N可用
  • 13040-46-5 
  • # 172.21.85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/13040-46-5/
  • source ~/.gmx2022.5-remd.sh

  • (base) [chpeng@localhost 1]$ nohup gmx_mpi mdrun -v -deffnm md &
  • [1] 213756

  • (base) [chpeng@localhost 2]$ nohup gmx_mpi mdrun -v -deffnm md &
  • [2] 213791

  • (base) [chpeng@localhost 3]$ nohup gmx_mpi mdrun -v -deffnm md &
  • [3] 213835

  • # 已转移至 75.1 /home/data/zzy/project/hsbd/200ns-cmd/13040-46-5
  • 1486-70-0 | 3090
2025-1-4 已转移至4090
  • 3090 85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/200ns/1486-70-0
  • source ~/.gmx-2022.5-remd.sh
  • dddc@gpu2:~/zzy/project/hsbd/cmd/2024-3cl-13mol/200ns/1486-70-0$ nohup bash 3090-3parallel-cmdexp.sh &
  • [1] 983643

  • ########################## "3090-3parallel-cmdexp.sh" 17L, 353B ####################
  • source ~/.gmx-2022.5-remd.sh

  • mkdir 1 2 3
  • cd 1
  • cp ../md.tpr ./
  • gmx_mpi mdrun -v -deffnm md
  • echo "####### parallel cmd exp1 finished #########"

  • cd ../2
  • cp ../md.tpr ./
  • gmx_mpi mdrun -v -deffnm md
  • echo "####### parallel cmd exp2 finished #########"

  • cd ../3
  • cp ../md.tpr ./
  • gmx_mpi mdrun -v -deffnm md
  • echo "####### parallel cmd exp3 finished #########"
  • ####################################################################################
  • 20347-71-1
  • 75.1 /home/data/zzy/project/hsbd/200ns-cmd/20347-71-1
  • source ~/.gmx-2022.5-GPU.sh
  • export CUDA_VISIBLE_DEVICES=0,1,2 (一个任务交一块)
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20347-71-1/1$ nohup gmx_mpi mdrun -v -deffnm md &
  • [1] 699101
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20347-71-1/2$ nohup gmx_mpi mdrun -v -deffnm md &
  • [2] 699627
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20347-71-1/3$ nohup gmx_mpi mdrun -v -deffnm md &
  • [3] 699806
  • 20633-67-4 | 4090
  • 75.1 /home/data/zzy/project/hsbd/200ns-cmd/20633-67-4
  • source ~/.gmx-2022.5-GPU.sh
  • export CUDA_VISIBLE_DEVICES=0,1,2 (一个任务交一块)
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20633-67-4/1$ nohup gmx_mpi mdrun -v -deffnm md &
  • [1] 1827376
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20633-67-4/2$ nohup gmx_mpi mdrun -v -deffnm md &
  • [2] 1827643
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20633-67-4/3$ nohup gmx_mpi mdrun -v -deffnm md &
  • [3] 1827925
  • 472-15-1 | v100
  • 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/472-15-1/
  • (base) [chpeng@localhost 1]$ nohup gmx_mpi mdrun -v -deffnm md &
  • [1] 214837
  • (base) [chpeng@localhost 2]$ nohup gmx_mpi mdrun -v -deffnm md &
  • [2] 214870
  • (base) [chpeng@localhost 3]$ nohup gmx_mpi mdrun -v -deffnm md &
  • [3] 214902

  • # 2025-1-2 已转移至4090 /home/data/zzy/project/hsbd/200ns-cmd/472-15-1
  • 51059-44-0 | 4090
  • 75.1 /home/data/zzy/project/hsbd/200ns-cmd/51059-44-0
  • source ~/.gmx-2022.5-GPU.sh
  • export CUDA_VISIBLE_DEVICES=0,1,2 (一个任务交一块)
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/51059-44-0/2$ nohup gmx_mpi mdrun -v -deffnm md &
  • [1] 3047033
  • dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/51059-44-0/3$ nohup gmx_mpi mdrun -v -deffnm md &
  • [2] 3047128

  • # 第三任务未记录,但是也跑了

12.31 组会讨论后 朱老师建议跑100ns

100ns模拟记录

  • 53846-50-7 | 4090
  • 75.1 /home/data/zzy/project/hsbd/100ns-cmd/53846-50-7
  • 56083-03-5 | V100
  • 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/100ns/56083-03-5/
  • 59870-65-4 | 4090
  • # 4090 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal/59870-65-4/md-100ns
  • 78574-94-4 | 3090 
  • source ~/.gmx-2022.5-remd.sh
  • dddc@gpu2:~/zzy/project/hsbd/cmd/2024-3cl-13mol/100ns/78574-94-4$ nohup bash 3090-3parallel-cmdexp.sh &
  • [1] 2761257

  • # 已续跑
  • # 轨迹已转移至4090
  • 8049-97-6 | v100
  • # 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/100ns/8049-97-6

  • # 轨迹已转移至4090
  • 85999-40-2 | 4090
  • # 4090 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal/85999-40-2/md-100ns
  • 91433-17-9 | v100
  • # 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/100ns/
  • # 轨迹已转移至4090