7.13 6-10 pair

6-30 准备的体系用蓝色标出,7-13准备的体系用绿色标出

7-13 体系(6-10pair)

uniprot IDstructure_freeDisulfide
    Bond (pair)
Modified ResiduesMutantsMetal IONSseqence lengthpocket_sizestructure_boundMutantsModified ResiduesligandLigand FormulaMetal IONSpocket_sizemotion typemotion residuesRMSD_pocketcomments
A0A0H2UQE44YZ1_AnonenonenoneS042-6775404YW5_AnonenoneG39C14 H24 N2 O4none590PEF3961.32  
A0A0H3HP345I7E_Anonenonenonenone2764964BKU_Anonenone1S5C19 H26 N2 O2none504OMF2030.78 Two ligands in binding pocket. NAI (C21 H29 N7 O14 P2) and 1S5
A0A0H3K0B93VSK_Anonenonenonenone646373VSL_BnonenoneCEFC14 H15 N5 O5 S2none286PET621,E6233.62 simple system
A1E4A33ZV8_Anonenonenonenone190683ZV9_AnonenoneG74C16 H28 N2 O5none134PEH401.25 simple system

apo 体系

蛋白检查 & 清洗

pdb2pqr的输出结果要仔细检查氨基酸序列是否缺失
  • # v100 /home/databank/zzy/project/D3PM/0630/clean_system/pdb2pqr/0713/clean_system/pdb2pqr
  • # 从PDB 上下载挑选的10个PDB文件(PDB 批量下载可得到 pdbXXXX.ent,经检查,和原本的pdb完全一样)
  • # index 文件包含 体系 PDB ID 和 chainID,命令中直接通过grep 选中对应的链,这很方便
  • # 实际操作时,在 grep -v HETATM 前 检查了氨基酸外 原子,确认对体系影响不大后,全部删去

  • for i in {1..10};do a=`sed -n "${i}p" index|awk '{print $1}'`;b=`sed -n "${i}p" index|awk '{print $2}'`;mv pdb${a}.ent ${a}.pdb;pdb2pqr30 ${a}.pdb ${a}.pqr --ff AMBER --ffout AMBER --with-ph 7.0 --pdb-output ${a}_pdb2pqr.pdb --drop-water;awk -v chain="$b" '$5==chain{print}' ${a}_pdb2pqr.pdb|grep -v HETATM >${a}_${b}-pdb2pqr.pdb;rm ${a}.pqr;rm ${a}_pdb2pqr.pdb;done
  • 3zv8,3zv9 两个结构HIS A 189残基pdb 中只有一个原子坐标信息,pdb2pqr 会报错,将其删去
  • 4yz1 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr
  • 3vsk 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr
  • 3vsl 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr
  • 6b1l 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr

  • paste -d ' ' pdb2pqr/index ../../0630/clean_system/system-name|sed 's/ A/_A/g'|sed 's/ B/_B/g'|awk '{print $2,$1,$4}' >system-name

  • for i in {1..10};do a=`sed -n "${i}p" system-name|awk '{print $2}'`;b=`sed -n "${i}p" system-name|awk '{print $1}'`;echo "########## $a $b ###########";mkdir -p $b;cp pdb2pqr/${a}-pdb2pqr.pdb $b/;done

MD 自动化处理

  • # v100 /home/databank/zzy/project/D3PM/0713/MD_auto_workdir
  • # 2025-7-14 9:53 先提交 apo 的5个体系
  • # 总控脚本去除了 第一步的高斯优化
  • # 总控脚本注释了 最后一步的预平衡,改为手动提交
  • # 预平衡脚本调用3个GPU
  • source ~/zzy/gmx2024.4-gpu.sh
  • source ~/xcy/env/amber24.sh
  • export OMP_NUM_THREADS=10
  • export CUDA_VISIBLE_DEVICES=0,1,2

  • # v100上 3块GPU,一次只能交3个任务
  • for i in {4..5};do cp -r ../clean_system/system${i} ./;cp -r ../mdp/ system${i};done

  • python total_control-v2.py 0
  • # 成功完成
  • # npt3.gro 检查无误
  • 3zv8 体系本身就是中性(tleap 不需添加抗衡离子),这很少见

整理结果&生成tpr

  • # 85.9 /home/databank/zzy/project/D3PM/0713/MD_auto_finished
  • # 前期编写了结果处理脚本,将 MD_auto_workdir 里的所有输出文件都删除/转移
  • # 同时记录体系录入的时间
  • bash do.sh

  • # 注意存储空间
  • df -h

  • 75.3 /home/data/zyzhou/project/D3PM/0630-5apo-system/1um_cmd
  • # 2025-0714 从 v100 将 5个apo 体系转移到 75.3
  • # 运行 do.sh,基于  MD_auto_finished 里的npt3.gro 和 gmx.top,index.ndx打包成tpr
  • # 2025-07-14 修改了do.sh ,使其可以自动识别温控溶剂组并修改mdp

1us CMD

  • 75.3 /home/data/zyzhou/project/D3PM/0630-5apo-system/1um_cmd

complex 体系

配体下载&高斯优化

5F47 里的配体是糖,无法下载 配体坐标,直接pymol 保存出来
下载后检查位置是否正确
质子化预测
  • 23 /home/databank_70t/zzy/g16/D3PM/epik
  • # 完成后,该文件夹转入 0713 文件夹
高斯优化
  • 23 /home/databank_70t/zzy/g16/D3PM/0713
  • for i in {1..5};do a=`sed -n "${i}p" system-name|awk '{print $1}'`;b=`sed -n "${i}p" system-name|awk '{print $2}'|awk -F '_' '{print $1}'`;mkdir -p $a;cp ../epik/${b}-lig.sdf ${a}/;done

  • python check.py -i /home/databank_70t/zzy/g16/D3PM/0713/ -t sdf

  • date | sed "s/^/D3PM system: five g16 jobs submitted on /" >>nohup.out
  • nohup python lig_parameter_cal.py -i /home/databank_70t/zzy/g16/D3PM/0713/ -t sdf

MD 自动化处理

  • # v100 /home/databank/zzy/project/D3PM/0713/clean_system
  • # 从高斯优化服务器将高斯优化结果复制过来
  • scp -r dddc@172.21.85.23:/home/databank_70t/zzy/g16/D3PM/0713 raw_g16
  • # 将高斯优化数据复制到对应体系的文件夹中
  • (base) [chpeng@localhost clean_system]$ for i in {6..10};do grep system${i} system-name;cp -r raw_g16/system${i}/* system${i}/;done
  • system6 5f47_A pair1
  • system7 5gm8_B pair2
  • system8 5aa4_A pair3
  • system9 3vw0_D pair4
  • system10 3ku1_A pair5
  • # v100 /home/databank/zzy/project/D3PM/0713/MD_auto_workdir
  • # 总控脚本去除了 第一步的高斯优化
  • # 总控脚本注释了 最后一步的预平衡,改为手动提交
  • # 预平衡脚本调用3个GPU
  • source ~/zzy/gmx2024.4-gpu.sh
  • source ~/xcy/env/amber24.sh
  • export OMP_NUM_THREADS=10
  • export CUDA_VISIBLE_DEVICES=0,1,2

  • # v100上 3块GPU,一次只能交3个任务
  • for i in {6..8};do cp -r ../clean_system/system${i} ./;cp -r ../mdp/ system${i};done

  • python total_control-v2.py 1
  • # 成功完成
  • # npt3.gro 检查无误
  • 3kr9_A-pdb2pqr.pdb 体系(system5)报错,貌似是最后一个氨基酸上有原子名称无法识别,尝试把这些原子删了,让tleap 自己补齐
  • 该体系对应的 complex 3ku1_A-pdb2pqr.pdb (system10)也报错了,同样的处理方法
  • 进一步检查发现这个氨基酸是HIS,pdb2pqr没有给出其确定的质子化状态,tleap 不能识别HIS上的HD 氢原子,所以出错,这里,两个体系均将 222位的HIS上两个HD,一个HE删去,交予tleap进行质子化预测(tleap 预测为HIE) 
  • 3ku1_A-pdb2pqr.pdb 197-206位缺失 将 3kr9_A-pdb2pqr.pdb align ,直接复制这部分残基对应原子的行到  3ku1_A-pdb2pqr.pdb 中 

整理结果&生成tpr

  • # 85.9 /home/databank/zzy/project/D3PM/0630/MD_auto_finished
  • # 前期编写了结果处理脚本,将 MD_auto_workdir 里的所有输出文件都删除/转移
  • # 同时记录体系录入的时间
  • bash do.sh

  • # 注意存储空间
  • df -h

  • # 生成tpr
  • # 75.3 /home/data/MD_traj_dataset/D3PM/0713-5apo-system/1um_cmd
  • # 将体系的编号,名称整理在 index 中,运行脚本 do.sh 即可
  • # v100 rsync 到75.3
  • rsync -rzP MD_auto_finished/ dddc@172.21.75.3:/home/data/MD_traj_dataset/D3PM/0713-5apo-system/MD_auto_finished
  • # 注意,apo与complex相比 tc-grps 不同

  • source ~/.gmx2024.sh
  • ####################################  do.sh   #############################################
  • for i in {6..10}
  • do 

  • a=`sed -n "${i}p" index|awk '{print $1}'`
  • b=`sed -n "${i}p" index|awk '{print $2}'`

  • mkdir -p $b/md1 $b/md2 $b/md3

  • tc_sov_grp=`grep Water ../MD_auto_finished/result/$a/pre-equ/npt3/npt.mdp |awk '{print $4}'`
  • sed "s/Water_Na+/$tc_sov_grp/g" md_1us_complex.mdp >${b}/md_1us_complex.mdp

  • gmx_mpi grompp -f ${b}/md_1us_complex.mdp -c ../MD_auto_finished/result/$a/pre-equ/npt3/npt3.gro -p ../MD_auto_finished/result/${a}/parameters/gmx.top -n ../MD_auto_finished/result/${a}/parameters/index.ndx -o ${b}/${b}.tpr
  • cp ${b}/${b}.tpr ${b}/md1;cp ${b}/${b}.tpr ${b}/md2;cp ${b}/${b}.tpr ${b}/md3

  • done
  • ###############################################################################################

  • bash do.sh
  • # 2025-07-15 完成tpr生成,随时可以提交MD任务

1us CMD

  • 75.3 /home/data/zyzhou/project/D3PM/0713-5apo-system/1um_cmd/