7.13 6-10 pair
6-30 准备的体系用蓝色标出,7-13准备的体系用绿色标出
7-13 体系(6-10pair)
uniprot ID | structure_free | Disulfide Bond (pair) | Modified Residues | Mutants | Metal IONS | seqence length | pocket_size | structure_bound | Mutants | Modified Residues | ligand | Ligand Formula | Metal IONS | pocket_size | motion type | motion residues | RMSD_pocket | comments |
A0A0H2UQE4 | 4YZ1_A | none | none | none | S042- | 677 | 540 | 4YW5_A | none | none | G39 | C14 H24 N2 O4 | none | 590 | PE | F396 | 1.32 | |
A0A0H3HP34 | 5I7E_A | none | none | none | none | 276 | 496 | 4BKU_A | none | none | 1S5 | C19 H26 N2 O2 | none | 504 | OM | F203 | 0.78 | Two ligands in binding pocket. NAI (C21 H29 N7 O14 P2) and 1S5 |
A0A0H3K0B9 | 3VSK_A | none | none | none | none | 646 | 37 | 3VSL_B | none | none | CEF | C14 H15 N5 O5 S2 | none | 286 | PE | T621,E623 | 3.62 | simple system |
A1E4A3 | 3ZV8_A | none | none | none | none | 190 | 68 | 3ZV9_A | none | none | G74 | C16 H28 N2 O5 | none | 134 | PE | H40 | 1.25 | simple system |
apo 体系
蛋白检查 & 清洗
pdb2pqr的输出结果要仔细检查氨基酸序列是否缺失
- # v100 /home/databank/zzy/project/D3PM/0630/clean_system/pdb2pqr/0713/clean_system/pdb2pqr
- # 从PDB 上下载挑选的10个PDB文件(PDB 批量下载可得到 pdbXXXX.ent,经检查,和原本的pdb完全一样)
- # index 文件包含 体系 PDB ID 和 chainID,命令中直接通过grep 选中对应的链,这很方便
- # 实际操作时,在 grep -v HETATM 前 检查了氨基酸外 原子,确认对体系影响不大后,全部删去
- for i in {1..10};do a=
`sed -n "${i}p" index|awk '{print $1}'`
;b=`sed -n "${i}p" index|awk '{print $2}'`
;mv pdb${a}.ent ${a}.pdb;pdb2pqr30 ${a}.pdb ${a}.pqr --ff AMBER --ffout AMBER --with-ph 7.0 --pdb-output ${a}_pdb2pqr.pdb --drop-water;awk -v chain="$b" '$5==chain{print}' ${a}_pdb2pqr.pdb|grep -v HETATM >${a}_${b}-pdb2pqr.pdb;rm ${a}.pqr;rm ${a}_pdb2pqr.pdb;done
- 3zv8,3zv9 两个结构HIS A 189残基pdb 中只有一个原子坐标信息,pdb2pqr 会报错,将其删去
- 4yz1 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr
- 3vsk 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr
- 3vsl 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr
- 6b1l 体系 直接 pdb2pqr 的话链没有补齐,用本地2017薛定谔 进行了补链再pdb2pqr
- paste -d ' ' pdb2pqr/index ../../0630/clean_system/system-name|sed 's/ A/_A/g'|sed 's/ B/_B/g'|awk '{print $2,$1,$4}' >system-name
- for i in {1..10};do a=
`sed -n "${i}p" system-name|awk '{print $2}'`
;b=`sed -n "${i}p" system-name|awk '{print $1}'`
;echo "########## $a $b ###########";mkdir -p $b;cp pdb2pqr/${a}-pdb2pqr.pdb $b/;done
MD 自动化处理
- # v100 /home/databank/zzy/project/D3PM/0713/MD_auto_workdir
- # 2025-7-14 9:53 先提交 apo 的5个体系
- # 总控脚本去除了 第一步的高斯优化
- # 总控脚本注释了 最后一步的预平衡,改为手动提交
- # 预平衡脚本调用3个GPU
- source ~/zzy/gmx2024.4-gpu.sh
- source ~/xcy/env/amber24.sh
- export OMP_NUM_THREADS=10
- export CUDA_VISIBLE_DEVICES=0,1,2
- # v100上 3块GPU,一次只能交3个任务
- for i in {4..5};do cp -r ../clean_system/system${i} ./;cp -r ../mdp/ system${i};done
- python total_control-v2.py 0
- # 成功完成
- # npt3.gro 检查无误
- 3zv8 体系本身就是中性(tleap 不需添加抗衡离子),这很少见
整理结果&生成tpr
- # 85.9 /home/databank/zzy/project/D3PM/0713/MD_auto_finished
- # 前期编写了结果处理脚本,将 MD_auto_workdir 里的所有输出文件都删除/转移
- # 同时记录体系录入的时间
- bash do.sh
- # 注意存储空间
- df -h
- 75.3 /home/data/zyzhou/project/D3PM/0630-5apo-system/1um_cmd
- # 2025-0714 从 v100 将 5个apo 体系转移到 75.3
- # 运行 do.sh,基于 MD_auto_finished 里的npt3.gro 和 gmx.top,index.ndx打包成tpr
- # 2025-07-14 修改了do.sh ,使其可以自动识别温控溶剂组并修改mdp
1us CMD
- 75.3 /home/data/zyzhou/project/D3PM/0630-5apo-system/1um_cmd
complex 体系
配体下载&高斯优化
5F47 里的配体是糖,无法下载 配体坐标,直接pymol 保存出来
下载后检查位置是否正确
质子化预测
- 23 /home/databank_70t/zzy/g16/D3PM/epik
- # 完成后,该文件夹转入 0713 文件夹
高斯优化
- 23 /home/databank_70t/zzy/g16/D3PM/0713
- for i in {1..5};do a=
`sed -n "${i}p" system-name|awk '{print $1}'`
;b=`sed -n "${i}p" system-name|awk '{print $2}'|awk -F '_' '{print $1}'`
;mkdir -p $a;cp ../epik/${b}-lig.sdf ${a}/;done - python check.py -i /home/databank_70t/zzy/g16/D3PM/0713/ -t sdf
- date | sed "s/^/D3PM system: five g16 jobs submitted on /" >>nohup.out
- nohup python lig_parameter_cal.py -i /home/databank_70t/zzy/g16/D3PM/0713/ -t sdf
MD 自动化处理
- # v100 /home/databank/zzy/project/D3PM/0713/clean_system
- # 从高斯优化服务器将高斯优化结果复制过来
- scp -r dddc@172.21.85.23:/home/databank_70t/zzy/g16/D3PM/0713 raw_g16
- # 将高斯优化数据复制到对应体系的文件夹中
- (base) [chpeng@localhost clean_system]$ for i in {6..10};do grep system${i} system-name;cp -r raw_g16/system${i}/* system${i}/;done
- system6 5f47_A pair1
- system7 5gm8_B pair2
- system8 5aa4_A pair3
- system9 3vw0_D pair4
- system10 3ku1_A pair5
- # v100 /home/databank/zzy/project/D3PM/0713/MD_auto_workdir
- # 总控脚本去除了 第一步的高斯优化
- # 总控脚本注释了 最后一步的预平衡,改为手动提交
- # 预平衡脚本调用3个GPU
- source ~/zzy/gmx2024.4-gpu.sh
- source ~/xcy/env/amber24.sh
- export OMP_NUM_THREADS=10
- export CUDA_VISIBLE_DEVICES=0,1,2
- # v100上 3块GPU,一次只能交3个任务
- for i in {6..8};do cp -r ../clean_system/system${i} ./;cp -r ../mdp/ system${i};done
- python total_control-v2.py 1
- # 成功完成
- # npt3.gro 检查无误
- 3kr9_A-pdb2pqr.pdb 体系(system5)报错,貌似是最后一个氨基酸上有原子名称无法识别,尝试把这些原子删了,让tleap 自己补齐
- 该体系对应的 complex 3ku1_A-pdb2pqr.pdb (system10)也报错了,同样的处理方法
- 进一步检查发现这个氨基酸是HIS,pdb2pqr没有给出其确定的质子化状态,tleap 不能识别HIS上的HD 氢原子,所以出错,这里,两个体系均将 222位的HIS上两个HD,一个HE删去,交予tleap进行质子化预测(tleap 预测为HIE)
- 3ku1_A-pdb2pqr.pdb 197-206位缺失 将 3kr9_A-pdb2pqr.pdb align ,直接复制这部分残基对应原子的行到 3ku1_A-pdb2pqr.pdb 中
整理结果&生成tpr
- # 85.9 /home/databank/zzy/project/D3PM/0630/MD_auto_finished
- # 前期编写了结果处理脚本,将 MD_auto_workdir 里的所有输出文件都删除/转移
- # 同时记录体系录入的时间
- bash do.sh
- # 注意存储空间
- df -h
- # 生成tpr
- # 75.3 /home/data/MD_traj_dataset/D3PM/0713-5apo-system/1um_cmd
- # 将体系的编号,名称整理在 index 中,运行脚本 do.sh 即可
- # v100 rsync 到75.3
- rsync -rzP MD_auto_finished/ dddc@172.21.75.3:/home/data/MD_traj_dataset/D3PM/0713-5apo-system/MD_auto_finished
- # 注意,apo与complex相比 tc-grps 不同
- source ~/.gmx2024.sh
- #################################### do.sh #############################################
- for i in {6..10}
- do
- a=
`sed -n "${i}p" index|awk '{print $1}'`
- b=
`sed -n "${i}p" index|awk '{print $2}'`
- mkdir -p $b/md1 $b/md2 $b/md3
- tc_sov_grp=
`grep Water ../MD_auto_finished/result/$a/pre-equ/npt3/npt.mdp |awk '{print $4}'`
- sed "s/Water_Na+/$tc_sov_grp/g" md_1us_complex.mdp >${b}/md_1us_complex.mdp
- gmx_mpi grompp -f ${b}/md_1us_complex.mdp -c ../MD_auto_finished/result/$a/pre-equ/npt3/npt3.gro -p ../MD_auto_finished/result/${a}/parameters/gmx.top -n ../MD_auto_finished/result/${a}/parameters/index.ndx -o ${b}/${b}.tpr
- cp ${b}/${b}.tpr ${b}/md1;cp ${b}/${b}.tpr ${b}/md2;cp ${b}/${b}.tpr ${b}/md3
- done
- ###############################################################################################
- bash do.sh
- # 2025-07-15 完成tpr生成,随时可以提交MD任务
1us CMD
- 75.3 /home/data/zyzhou/project/D3PM/0713-5apo-system/1um_cmd/