5.29 get npt.gro
进度
高斯优化:250 / 569
蛋白结构清洗:10 / 250
预平衡:3 / 10
检查高斯优化情况
- tail -n1 */lig*/*log
- # 检查是否 Normal termination of Gaussian 16 at xxxxx(Time)
体系 1-100
- # 75.3 /home/data/zyzhou/project/koff/pdbbind_dataset/g16_1-10
- # 0/10体系报错
- # 成功10/10
- awk '{printf "system%d %s\n", NR, $0}' index_1-10 >sys_name_1-10
- # 转移至 v100 服务器
- # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
- scp -r dddc@172.21.75.3:/home/data/zyzhou/project/koff/pdbbind_dataset/g16_1-10 ./
- # 85.24 /home/databank/zzy/project/MD/koff/pdbbind_dataset/g16_11-40
- # 1/30体系报错
- # 1ec2_ligand_b412_753_dock 体系报错(N上5根键)
- # 0529-19:47
- # 成功28/29
- # 1eby_ligand_b388_770_dock 任务运行中
- ########################## 以下为计划,尚未运行 ###############################################
- awk '{printf "system%d %s\n", NR+10, $0}' index_11-40 >sys_name_11-40
- # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
- scp -r dddc@172.21.85.24:/home/databank/zzy/project/MD/koff/pdbbind_dataset/g16_11-40 ./
- # 85.23 /home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_41-70
- # 1/30体系报错
- # 1q84_ligand_native_291.sdf 体系报错(sdf中第37位的C上是3根键,经检查,发现PDBBind出错了,pdb原始结构显示这个C所在的是个芳香环,但是PDBBind的mol2文件给这个C标识的是C.3也就是sp3杂化,这样3根键就报错了。我在pdb 1q84的页面下下载mol2文件,检查发现,这个C的原子类型应该是C.ar也就是芳香C)
- # 成功29/29
- awk '{printf "system%d %s\n", NR+40, $0}' index_41-70 > sys_name_41-70
- # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
- scp -r dddc@172.21.85.23:/home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_41-70 ./
- # 85.23 /home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_71-100
- # 4/30体系报错
- # 报错原因待检查
- # 成功26/26
- awk '{printf "system%d %s\n", NR+70, $0}' index_71-100 > sys_name_71-100
- # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
- scp -r dddc@172.21.85.23:/home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_71-100 ./
蛋白结构清洗
v100 运行 & 75.2 存储
- # v100 /home/databank/zzy/project/koff/pdbbind_dataset/clean_system
- # 从 g16_raw 文件夹中把 高斯优化完成的体系 复制过来并命名为 systemX 的形式
- # 原始pdb文件去除氢原子,pdb2pqr 在pH=7预测质子化状态
- for i in {1..10};do sys=
`sed -n "${i}p" sys_name_1-10|awk '{print $1}'`
;name=`sed -n "${i}p" sys_name_1-10|awk '{print $2}'`
;cp -r ../g16_raw/g16_1-10/${name} ${sys};mv ${sys}/*pdb ${sys}/with_H.txt;awk '$12!="H"{print}' ${sys}/with_H.txt >${sys}/${sys}_raw_noH.pdb;pdb2pqr30 ${sys}/${sys}_raw_noH.pdb ${sys}/${sys}.pqr --ff AMBER --ffout AMBER --with-ph 7 --pdb-output ${sys}/${sys}.pdb;rm ${sys}/${sys}_raw_noH.pdb;rm ${sys}/${sys}.log;done
MD 自动化处理
- # /home/databank/zzy/project/koff/pdbbind_dataset/MD_auto_workdir
- # 总控脚本去除了 第一步的高斯优化
- # 总控脚本注释了 最后一步的预平衡,改为手动提交
- # 预平衡脚本调用3个GPU
- source ~/zzy/gmx2024.4-gpu.sh
- export OMP_NUM_THREADS=10
- export CUDA_VISIBLE_DEVICES=0,1,2
- # v100上 3块GPU,一次只能交3个任务
- for i in {1..3};do cp -r ../clean_system/system${i} ./;cp -r ../mdp/ system${i};done
- # 0530 修改了 amber_to_gmx-add_restraint.py 后解决了同源二聚体位置限制 超出index的问题
- python total_control-v2.py 1
- # 成功完成
- # npt3.gro 检查无误
整理结果
- # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/MD_auto_finished
- # 编写了结果处理脚本,将 MD_auto_workdir 里的所有输出文件都删除/转移
- # 在确认体系没问题的情况下,可以直接运行,整理结果
- sh do.sh