3.17 md补充实验

前期工作中,对11个送测活性的成分与mpro(二聚体)/ plpro(三聚体)都做了100ns的CMD模拟。初步分析轨迹,mmgsba计算结合自由能发现,结合自由能与活性数据相关性较差,且涉及PLpro的三聚体的复合物CMD模拟构象波动极大。故计划将CMD模拟部分作为活性测试后的分子机制(蛋白-配体作用)阐明。梳理后的逻辑为:对有活性的4个源自HSBD的关键天然产物进行mpro/plpro 的D3Docking全库对接(所有构象,所有口袋),找打分最好的那个对接结果构建CMD初始构象,跑CMD模拟,进行分析;

打分最好的对接结果(初始构象)

蛋白准备

本次重新准备,全部选用 D3Docking 库中的 受体结构文件(pdb) - pdb2pqr
  • 85.23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/pro
  • grep -v H0 ../ORF1ab_3264-3569_3C-like_proteinase+Dimer.pdb|grep -v H1 
  • # 蛋白pdb中原有的H0,H1无法识别,需要全部去掉
  • grep -v H0 from_d3dock_pdb/ORF1ab_3264-3569_3C-like_proteinase+Dimer.pdb|grep -v H1 >d3dock_noH_3CL_Dimer.pdb

  • grep -v H0 from_d3dock_pdb/ORF1ab_3264-3569_3C-like_proteinase+Monomer.pdb|grep -v H1 >d3dock_noH_3CL_Monomer.pdb

  • grep -v H0 from_d3dock_pdb/ORF1ab_819-2763_Papain-like_proteinase+Monomer.pdb|grep -v H1 >d3dock_noH_PL_Monomer.pdb

  • grep -v H0 from_d3dock_pdb/ORF1ab_819-2763_Papain-like_proteinase+Dimer.pdb|grep -v H1 >d3dock_noH_PL_Dimer.pdb
  • 85.23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/pro/pdb2pqr
  • pdb2pqr30  ../d3dock_noH_3CL_Dimer.pdb 3CL_Dimer.pqr  --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output 3CL_Dimer.pdb

  • pdb2pqr30  ../d3dock_noH_3CL_Monomer.pdb 3CL_Monomer.pqr  --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output 3CL_Monomer.pdb

  • pdb2pqr30  ../d3dock_noH_PL_Monomer.pdb PL_Monomer.pqr  --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output PL_Monomer.pdb

  • pdb2pqr30  ../d3dock_noH_PL_Dimer.pdb PL_Dimer.pqr  --ff AMBER --ffout AMBER --with-ph 7.4 --pdb-output PL_Dimer.pdb

配体准备

坐标信息(d3dock)

  • # 23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/ligand/d3dock
  • cp ../../../d3dock/results/TCMID-15972/ORF1ab_819-2763_Papain-like_proteinase+Dimer/PDB/TCMID-15972-pocket1-0.sdf 91433-17-9-dock.sdf

  • cp ../../../d3dock/results/TCMID-16012/ORF1ab_819-2763_Papain-like_proteinase+Dimer/PDB/TCMID-16012-pocket3-0.sdf 1486-70-0-dock-PL.sdf

  • cp ../../../d3dock/results/TCMID-27300/ORF1ab_819-2763_Papain-like_proteinase+Monomer/PDB/TCMID-27300-pocket1-0.sdf 56083-03-5-dock-PL.sdf

  • cp ../../../d3dock/results/TCMID-27300/ORF1ab_3264-3569_3C-like_proteinase+Monomer/PDB/TCMID-27300-pocket1-0.sdf 56083-03-5-dock-3CL.sdf

  •  cp ../../../d3dock/results/TCMID-27476/ORF1ab_3264-3569_3C-like_proteinase+Dimer/PDB/TCMID-27476-pocket2-0.sdf 59870-65-4-dock-3CL.sdf

质子化预测

  • 23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/ligand/d3dock/ligprep
  • for a in `cat index`;do ~/software/Schrodinger_Suites_2021-2/ligprep -R e -epik -ph 7.4 -pht 0.0 -isd ../${a}.sdf -osd ./${a}.sdf;done

高斯优化

  • 23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/ligand/g16
  • # 使用antechamber生成配体小分子参数(85.23)
  • for i in `cat index`;do mkdir $i;cd $i;antechamber -i ../../d3dock/ligprep/${i}.sdf -fi sdf -o $i.gjf -fo gcrt;sed -i '1,3d' $i.gjf;sed -i '1i %mem=4GB\n%nproc=4\n#B3LYP/6-31G* Pop=MK iop(6/33=2) iop(6/42=6) opt' $i.gjf;cd ../;done

  • # 提交 高斯优化任务 23:05

  • for i in `cat index`;do cd $i;antechamber -i $i.log -fi gout -o $i.prep -fo prepi -c resp;parmchk2 -i $i.prep -f prepi -o $i.frcmod -a y;cd ../;done

复合物体系准备

  • 23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/ligand/atom_name_check
  • # 用师妹的脚本
  • # 把 ATOMTYPE.INF ATOMTYPE.INF 复制到各个配体的文件夹下
  • # 将d3dock的配体对接结果(sdf文件)转换为pdb文件
  • # 2025-3-18 10:30 先用师妹原始的脚本(可处理sdf文件,但是不能自动识别文件夹并处理)
  • ls ../g16/>index
  • for i in `cat index`;do mkdir -p $i;cp ../g16/$i/ATOMTYPE.INF $i/;cp ../g16/$i/NEWPDB.PDB $i/;cp ../d3dock/ligprep/${i}.sdf $i/;sed "s/XXXX/${i}.sdf/g" atom_name_check-raw.py >$i/atom_name_check-raw.py;cd $i;python atom_name_check-raw.py;cd ../;done
  • # 可视化检查没问题

tleap

  • # 23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/tleap
  • # 加载环境
  • source ~/zzy/ff19sb.sh

  • # 使用我自己编写的脚本
  • # 将需要的文件命名为需要的形式即可
  • for i in `cat index`;do mkdir -p $i;cp ../ligand/g16/$i/*frcmod ./$i/lig.frcmod;cp ../ligand/g16/$i/*prep ./$i/lig.prep;cp ../ligand/atom_name_check/$i/LIG.PDB ./$i/lig.pdb;done

  • (base) [dddc@localhost 91433-17-9-dock-PL]$ cp ../../pro/pdb2pqr/PL_Dimer.pdb ./pro.pdb
  • (base) [dddc@localhost 1486-70-0-dock-PL]$ cp ../../pro/pdb2pqr/PL_Dimer.pdb ./pro.pdb
  • (base) [dddc@localhost 56083-03-5-dock-PL]$ cp ../../pro/pdb2pqr/PL_Monomer.pdb ./pro.pdb
  • (base) [dddc@localhost 56083-03-5-dock-3CL]$ cp ../../pro/pdb2pqr/3CL_Monomer.pdb ./pro.pdb
  • (base) [dddc@localhost 59870-65-4-dock-3CL]$ cp ../../pro/pdb2pqr/3CL_Dimer.pdb ./pro.pdb

  • for  i in `cat index`;do cp md_parm_gen_chinese.py $i;cd $i;python md_parm_gen_chinese.py 1;cd ../;done
  • # 蛋白文件手动复制,文件名统一为pro.pdb
  • # 可视化检查
  • # 56083-03-5两个体系配体坐标信息不对,检查
  • # 56083-03-5 二聚体,要检查

amber_to_gmx

  • # 23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/sys-pre/amber_to_gmx
  • # 使用紫玉的脚本
  • # 3CL二聚体两条件需要分别进行位置限制,PL两条链看起来完全一样(system1显示有两个),无需操作
  • ####################################  do.sh  #############################################
  • for i in `cat index`
  • do 
  • mkdir -p $i
  • cp ../tleap/$i/complex* $i
  • cd $i
  • cp ../amber_to_gmx-add_restraint.py ./
  • python amber_to_gmx-add_restraint.py 0 complex.prmtop complex.inpcrd
  • python amber_to_gmx-add_restraint.py 1
  • (echo '1|13'; echo 'q') | gmx_mpi make_ndx -f gmx.gro -o index.ndx
  • echo 1|gmx_mpi genrestr -f gmx.gro -n index.ndx -o posre1.itp
  • cd ../
  • done
  • ############################################################################################

手动修改:
  1.  所有的二聚体,都要检查posre1.itp ,其中的原子数与top里 sytem1一样
  2.  根据配体原子数生成 posre2.itp
  3.  3CL二聚体有 system1 system2 system3 (二聚体两条链不完全一致)

预平衡

  • # 4090 /home/data/zzy/project/hsbd/2025-4bioactive/pre-equ
  • # min-nvt-npt.sh 在mdp文件合适的情况下仅需要修改工作路径,就可以自动完成所有体系的预平衡

  • dddc@gpu-4090:/home/data/zzy/project/hsbd/2025-4bioactive/pre-equ$ nohup bash min-nvt-npt.sh &
  • [1] 2697051

MD模拟任务

  • 75.3 /home/dddc/zyzhou/project/hsbd/2025-4bioactive/cmd/100ns/
2025-03-20 5个体系中4个已结束,先进行轨迹分析
91433-17-9-dock-PL 在4090上进行中

轨迹分析

The results are presented in three parts: (i) the “Dynamic Behavior of Complexes” section, which discusses RMSD and RMSF analyses; (ii) the “Predicted Highly Frequent Residues of Ligand Binding” section, which examines the interaction frequencies between ligands and key residues; and (iii) the “Essential Residues in Protein–Ligand Binding” section, which uses MM/GBSA calculations to identify critical binding residues.

周期性处理

  • # GMX -pbc nojump -ur compact + -fit rot+trans
  • scp dddc@172.21.85.23:/home/databank_70t/zzy/project/hsbd/2024-pl-13mol/analysis/periodic-processing/*sh ./
  • # 修改工作路径后,可自动处理轨迹,间隔2000帧输出轨迹可视化结果,需要逐个检查

RMSD

  • 75.3 /home/dddc/zyzhou/project/hsbd/2025-4bioactive/cmd/analysis/rmsd
  • scp dddc@172.21.85.23:/home/databank_70t/zzy/project/hsbd/2024-pl-13mol/analysis/rmsd/complex/* ./
  • # 之前有写过脚本,可直接使用,需要修改路径
  • # 作图脚本需要逐行检查
  • # 已出图,没问题

RMSF

  • 75.3 /home/dddc/zyzhou/project/hsbd/2025-4bioactive/cmd/analysis/rmsf
  • cp ../rmsd/* ./
  • # 与rmsd的脚本逻辑几乎完全一致,rmsf的gmx计算命令稍有不同,修改即可
  • # 作图脚本需要逐行检查

  • # RMSF是根据残基计算的(-res),在处理双链时需要注意,两条链需要分开处理
  • # 本身也是很有意思的信息,双链RMSF波动的区别可以一定程度上反应配体的结合吗?

  • # 看了一下,两条链中差距不算大
  • # 分别做了两条链按照残基取平均的结果和比较每次平行实验两条链RMSF的图

  • # 两条链取平均后,三次实验再取平均的图(简单说明体系稳定)还没做

MM/GBSA

  • 85.23 /home/databank_70t/zzy/project/hsbd/2025-4bioactive/analysis/mmgbsa
  • (base) [dddc@localhost workdir]$ nohup bash mmgbsa-cal.sh &
  • [1] 213572
  • # 已在23上提交任务 18:28

  • # 尝试在75.3上安装amber24
  • # /home/dddc/zyzhou/software/amber24/amber24_src
  • # ./update_amber --update 已完成 18:32