12.19-26 MD pre (3CL)
蛋白准备
整理了一下13个化合物打分,发现打分最高的3CL受体是 3C_like_proteinase+Dimer+6Y2G,PL是 Papain-like_proteinase+Trimer+6W9C
12月初,对原花青素与白桦脂酸进行了CMD 模拟。当时用的受体如下图所示
本次重新准备,全部选用晶体结构-D3Docking的原始pdb文件-pdb2pqr
- 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/pro/pdb2pqr
- pdb2pqr30 ../d3dock-result-pdb/3C_like_proteinase+Dimer+6Y2G.pdb 3C_like_proteinase+Dimer+6Y2G.pqr --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output 3cl-dimer.pdb
- pdb2pqr30 ../d3dock-result-pdb/Papain-like_proteinase+Trimer+6W9C.pdb Papain-like_proteinase+Trimer+6W9C.pqr --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output pl-trimer.pdb
3CL与PL分开准备
- 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol
- 85.23 /home/databank_70t/zzy/project/hsbd/2024-pl-13mol
生成配体参数
CAS-mol
- 检查CAS号,与PMS系统中的依次对照,确保一致;
- puchem根据 CAS号下载3D结构(sdf),注意这个3D结构也不是特别靠谱PubChem3D - PubChem;
- 对下载的sdf进行检查,将名字改为CAS号
- schrodinger2017 ligprep
- ligprep结果上传 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/ligand
高斯优化
472-15-1与20347-71-1前期优化过了
以下操作适用于其余11个配体
其中 51059-44-0 与 85999-40-2 带一个负电(羧基),其余都是中性
- 2. 使用antechamber生成配体小分子参数(85.23)
- # /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep
- # !!!!!!!!!!记得挨个检查电荷哇!!!!!!!
- for i in
`cat index`
;do mkdir $i;cd $i;antechamber -i ../../../ligand/${i}.sdf -fi sdf -o $i.gjf -fo gcrt;sed -i '1,3d' $i.gjf;sed -i '1i %mem=4GB\n%nproc=4\n#B3LYP/6-31G* Pop=MK iop(6/33=2) iop(6/42=6) opt' $i.gjf;cd ../;done - # 修改 51059-44-0 与 85999-40-2 电荷为-1
- # 提交 高斯优化任务
- [1] Running nohup g16 13040-46-5.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/13040-46-5)
- [2] Running nohup g16 1486-70-0.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/1486-70-0)
- [3] Running nohup g16 20633-67-4.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/20633-67-4)
- [4] Running nohup g16 51059-44-0.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/51059-44-0)
- [5] Running nohup g16 53846-50-7.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/53846-50-7)
- [6] Running nohup g16 56083-03-5.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/56083-03-5)
- [7] Running nohup g16 59870-65-4.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/59870-65-4)
- [8] Running nohup g16 78574-94-4.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/78574-94-4)
- [9] Running nohup g16 8049-97-6.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/8049-97-6)
- [10]- Running nohup g16 85999-40-2.gjf & (wd: /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/ligprep/85999-40-2)
- [11]+ Running nohup g16 91433-17-9.gjf &
- for i in
`cat index`
;do cd $i;antechamber -i $i.log -fi gout -o $i.prep -fo prepi -c resp;parmchk2 -i $i.prep -f prepi -o $i.frcmod -a y;cd ../;done
复合物体系准备
复合物初始构象的坐标就采用D3Docking的对接结果
gv-check
- # 85.23 /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/gv
- for i in
`cat ../index`
;do cp ../ligprep/${i}/NEWPDB.PDB rawg16-${i}.pdb;done - for i in {1..13};do a=
`sed -n "${i}p" tcmid-cas|awk '{print $1}'`
;b=`sed -n "${i}p" tcmid-cas|awk '{print $2}'`
;cp /home/databank_70t/zzy/project/hsbd/D3Targets-dock/workdir/3cl-pl-real-allconf-best-pkt/md-conf/3C_like_proteinase+Dimer+6Y2G/$a/*sdf ./d3dock-${b}.sdf;done - # 本地 gv
- # gv里分别打开 NEWPDB.PDB(rawg16-${i}.pdb) 与 d3dock-${i}.sdf
- 打开GV tools-atom list-鼠标点击symbol列-rows-sort selected -拖动鼠标选择所有H-edit-delete-selected atoms),接着仍在atom list中,edit-z matrix-standardize,保存。
- 得到 g16-gv-${i}.pdb dock-${i}-gv.pdb
- # GV里 检查 g16-gv-${i}.pdb 与 dock-${i}-gv.pdb,更改 dock-${i}-gv.pdb (atom list - Tag),使其Tag 与g16-gv.pdb 完全一致,修改后得到 dock-${i}-gv-checked.pdb
- # /home/databank_70t/zzy/people/samuel/20241016-t13-5mol-cmd/sys-pre/gv-check
- dos2unix *
- sh gv-check-lig.sh
- #### "gv-check-lig.sh" 6L, 207C #############################################################
- for i in
`cat index`
- do
- grep -v "CONECT" g16-gv-${i}.pdb |cut -b 1-26 > symbol-${i}
- grep -v "CONECT" dock-${i}-gv-checked.pdb | cut -b 29-78 > coordinate-${i}
- paste -d " " symbol-${i} coordinate-${i} > lig-${i}.pdb
- done
- #############################################################################################
tleap
- # /home/databank_70t/zzy/project/hsbd/2024-3cl-13mol/sys-pre/tleap
- # 23上原本是默认的amber18的tleap,其中无ff19sb力场,需要通过tleap -I 调用conda ambertools下的环境,实操中,会因为有默认的amber18路径,加载参数有Warning,故新建了一个不默认调用amber18的环境 ~/zzy/ff19sb.sh (复制 ~/.bashrc 仅修改了amber18字段)
- ##########################################################################################
- # zyzhou 20241020 remove amber18 and add conda ambertools to source ff19sb
- export PATH=/home/dddc/anaconda3/envs/ambertools/bin:$PATH
- #source /home/dddc/software/amber18/amber.sh
- export LD_LIBRARY_PATH=/home/dddc/anaconda3/envs/ambertools/lib:${LD_LIBRARY_PATH}
- ##########################################################################################
- # 加载环境
- source ~/zzy/ff19sb.sh
- # 自动化流程 tleap
- nohup sh tleap.sh
- # tleap.sh 的具体代码可在工作路径查看
- # 有几个注意点
- 1. tleap.in 最后写个quit,可丝滑推出tleap;
- 2. make_ndx 需要使用 (echo '1|13'; echo 'q') | gmx_mpi make_ndx -f gromacs.gro -o index.ndx 来确保选中了 1|13
- 3. 本次13个化合物里,472-15-1;51059-44-0;85999-40-2三个是带1个负电荷的,tleap.in指定加了9个钠离子,其他的10个化合物都是加8个钠离子就够了
- 4. 本实验中蛋白为二聚体,这种情况下,tleap.sh无法一步到位:蛋白会有system1,system2。他们的itp得分开写。这个时候,每个system里有多少原子要到 [ atoms ]里面去看,这个system的最后一个原子是多少。本次实验中(2024-12-26)该部分内容的操作记录如下,有时间要想办法流程化。
- # 85.23 作为备份,没修改,直接在预平衡的工作服务器-85.2 上做了修改
- # 85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/sys-pre/tleap
- # 原来给配体的那个itp 得改成posre3
- sed -i 's/posre2/posre3/g' */gmx/topol.top
- for i in
`cat ../index`
;do mv $i/gmx/posre2.itp $i/gmx/posre3.itp;done - # 每个体系蛋白两条链是一样的,所以统一制作posre1.itp posre2.itp
- # top的[ atoms ]里面去看,system1是4608,system2是4613,加起来和protein 这个组(9239)相等
- # 85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/sys-pre/tleap/itp 手动改一下
- # 注意!每个top文件插入的位置不同,写了个小脚本进行了文本插入
- ####################### "do.sh" 7L, 267B ##################################################
- for i in
`cat ../index`
- do
- cd $i/ gmx
- protein_itp_site=$(grep -n -B3 "system2" topol.top | head -n 1 | awk -F '-' '{print $1}')
- sed -i "${protein_itp_site} a ; Include Position restraint file\n#ifdef POSRES\n#include \"posre1.itp\"\n#endif" topol.top
- cd ../../
- done
- ###########################################################################################
- # 最后,对得到的体系进行检查
- # 检查电荷
- grep unperturbed */leap.log
- !!!!将com-dry.pdb下载下来检查!!!!
体系平衡
- # 172.21.85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal
- # min-nvt-npt.sh 在mdp文件合适的情况下仅需要修改工作路径,就可以自动完成所有体系的预平衡
- # mdp文件
- scp dddc@172.21.75.1:/home/data/zzy/project/hsbd/pre-bal/* ./
- dddc@gpu2:~/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal$ nohup bash min-nvt-npt.sh &
- [1] 2657894
200ns模拟记录
2024-12-26 17:45 仅有3090与GPU4N可用
- 13040-46-5
- # 172.21.85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/13040-46-5/
- source ~/.gmx2022.5-remd.sh
- (base) [chpeng@localhost 1]$ nohup gmx_mpi mdrun -v -deffnm md &
- [1] 213756
- (base) [chpeng@localhost 2]$ nohup gmx_mpi mdrun -v -deffnm md &
- [2] 213791
- (base) [chpeng@localhost 3]$ nohup gmx_mpi mdrun -v -deffnm md &
- [3] 213835
- # 已转移至 75.1 /home/data/zzy/project/hsbd/200ns-cmd/13040-46-5
- 1486-70-0 | 3090
2025-1-4 已转移至4090
- 3090 85.2 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/200ns/1486-70-0
- source ~/.gmx-2022.5-remd.sh
- dddc@gpu2:~/zzy/project/hsbd/cmd/2024-3cl-13mol/200ns/1486-70-0$ nohup bash 3090-3parallel-cmdexp.sh &
- [1] 983643
- ########################## "3090-3parallel-cmdexp.sh" 17L, 353B ####################
- source ~/.gmx-2022.5-remd.sh
- mkdir 1 2 3
- cd 1
- cp ../md.tpr ./
- gmx_mpi mdrun -v -deffnm md
- echo "####### parallel cmd exp1 finished #########"
- cd ../2
- cp ../md.tpr ./
- gmx_mpi mdrun -v -deffnm md
- echo "####### parallel cmd exp2 finished #########"
- cd ../3
- cp ../md.tpr ./
- gmx_mpi mdrun -v -deffnm md
- echo "####### parallel cmd exp3 finished #########"
- ####################################################################################
- 20347-71-1
- 75.1 /home/data/zzy/project/hsbd/200ns-cmd/20347-71-1
- source ~/.gmx-2022.5-GPU.sh
- export CUDA_VISIBLE_DEVICES=0,1,2 (一个任务交一块)
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20347-71-1/1$ nohup gmx_mpi mdrun -v -deffnm md &
- [1] 699101
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20347-71-1/2$ nohup gmx_mpi mdrun -v -deffnm md &
- [2] 699627
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20347-71-1/3$ nohup gmx_mpi mdrun -v -deffnm md &
- [3] 699806
- 20633-67-4 | 4090
- 75.1 /home/data/zzy/project/hsbd/200ns-cmd/20633-67-4
- source ~/.gmx-2022.5-GPU.sh
- export CUDA_VISIBLE_DEVICES=0,1,2 (一个任务交一块)
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20633-67-4/1$ nohup gmx_mpi mdrun -v -deffnm md &
- [1] 1827376
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20633-67-4/2$ nohup gmx_mpi mdrun -v -deffnm md &
- [2] 1827643
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/20633-67-4/3$ nohup gmx_mpi mdrun -v -deffnm md &
- [3] 1827925
- 472-15-1 | v100
- 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/472-15-1/
- (base) [chpeng@localhost 1]$ nohup gmx_mpi mdrun -v -deffnm md &
- [1] 214837
- (base) [chpeng@localhost 2]$ nohup gmx_mpi mdrun -v -deffnm md &
- [2] 214870
- (base) [chpeng@localhost 3]$ nohup gmx_mpi mdrun -v -deffnm md &
- [3] 214902
- # 2025-1-2 已转移至4090 /home/data/zzy/project/hsbd/200ns-cmd/472-15-1
- 51059-44-0 | 4090
- 75.1 /home/data/zzy/project/hsbd/200ns-cmd/51059-44-0
- source ~/.gmx-2022.5-GPU.sh
- export CUDA_VISIBLE_DEVICES=0,1,2 (一个任务交一块)
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/51059-44-0/2$ nohup gmx_mpi mdrun -v -deffnm md &
- [1] 3047033
- dddc@gpu-4090:/home/data/zzy/project/hsbd/200ns-cmd/51059-44-0/3$ nohup gmx_mpi mdrun -v -deffnm md &
- [2] 3047128
- # 第三任务未记录,但是也跑了
12.31 组会讨论后 朱老师建议跑100ns
100ns模拟记录
- 53846-50-7 | 4090
- 75.1 /home/data/zzy/project/hsbd/100ns-cmd/53846-50-7
- 56083-03-5 | V100
- 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/100ns/56083-03-5/
- 59870-65-4 | 4090
- # 4090 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal/59870-65-4/md-100ns
- 78574-94-4 | 3090
- source ~/.gmx-2022.5-remd.sh
- dddc@gpu2:~/zzy/project/hsbd/cmd/2024-3cl-13mol/100ns/78574-94-4$ nohup bash 3090-3parallel-cmdexp.sh &
- [1] 2761257
- # 已续跑
- # 轨迹已转移至4090
- 8049-97-6 | v100
- # 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/100ns/8049-97-6
- # 轨迹已转移至4090
- 85999-40-2 | 4090
- # 4090 /home/dddc/zzy/project/hsbd/cmd/2024-3cl-13mol/pre-bal/85999-40-2/md-100ns
- 91433-17-9 | v100
- # 85.9 /home/databank/zzy/project/hsbd/200ns-cmd/3cl-dimer/100ns/
- # 轨迹已转移至4090