5.29 get npt.gro

进度

高斯优化:250 / 569
蛋白结构清洗:10 / 250
预平衡:3 / 10

检查高斯优化情况

  • tail -n1 */lig*/*log
  • # 检查是否 Normal termination of Gaussian 16 at xxxxx(Time)

体系 1-100

  • # 75.3  /home/data/zyzhou/project/koff/pdbbind_dataset/g16_1-10
  • # 0/10体系报错 
  • # 成功10/10
  • awk '{printf "system%d %s\n", NR, $0}' index_1-10 >sys_name_1-10

  • # 转移至 v100 服务器
  • # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
  • scp -r dddc@172.21.75.3:/home/data/zyzhou/project/koff/pdbbind_dataset/g16_1-10 ./
  • # 85.24 /home/databank/zzy/project/MD/koff/pdbbind_dataset/g16_11-40
  • # 1/30体系报错 
  • # 1ec2_ligand_b412_753_dock 体系报错(N上5根键)
  • # 0529-19:47
  • # 成功28/29
  • # 1eby_ligand_b388_770_dock 任务运行中
  • ########################## 以下为计划,尚未运行 ###############################################
  • awk '{printf "system%d %s\n", NR+10, $0}' index_11-40 >sys_name_11-40

  • # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
  • scp -r dddc@172.21.85.24:/home/databank/zzy/project/MD/koff/pdbbind_dataset/g16_11-40 ./
  • # 85.23 /home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_41-70
  • # 1/30体系报错 
  • # 1q84_ligand_native_291.sdf 体系报错(sdf中第37位的C上是3根键,经检查,发现PDBBind出错了,pdb原始结构显示这个C所在的是个芳香环,但是PDBBind的mol2文件给这个C标识的是C.3也就是sp3杂化,这样3根键就报错了。我在pdb 1q84的页面下下载mol2文件,检查发现,这个C的原子类型应该是C.ar也就是芳香C)
  • # 成功29/29
  • awk '{printf "system%d %s\n", NR+40, $0}' index_41-70 > sys_name_41-70

  • # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
  • scp -r dddc@172.21.85.23:/home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_41-70 ./
  • # 85.23 /home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_71-100
  • # 4/30体系报错
  • # 报错原因待检查
  • # 成功26/26
  • awk '{printf "system%d %s\n", NR+70, $0}' index_71-100 > sys_name_71-100

  • # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/g16_raw
  • scp -r dddc@172.21.85.23:/home/databank_70t/zzy/project/koff/pdbbind_dataset/g16_71-100 ./

蛋白结构清洗

v100 运行 & 75.2 存储
  • # v100 /home/databank/zzy/project/koff/pdbbind_dataset/clean_system
  • # 从 g16_raw 文件夹中把 高斯优化完成的体系 复制过来并命名为 systemX 的形式
  • # 原始pdb文件去除氢原子,pdb2pqr 在pH=7预测质子化状态
  • for i in {1..10};do sys=`sed -n "${i}p" sys_name_1-10|awk '{print $1}'`;name=`sed -n "${i}p" sys_name_1-10|awk '{print $2}'`;cp -r ../g16_raw/g16_1-10/${name} ${sys};mv ${sys}/*pdb ${sys}/with_H.txt;awk '$12!="H"{print}' ${sys}/with_H.txt >${sys}/${sys}_raw_noH.pdb;pdb2pqr30 ${sys}/${sys}_raw_noH.pdb ${sys}/${sys}.pqr --ff AMBER --ffout AMBER --with-ph 7 --pdb-output ${sys}/${sys}.pdb;rm ${sys}/${sys}_raw_noH.pdb;rm ${sys}/${sys}.log;done

MD 自动化处理

  • # /home/databank/zzy/project/koff/pdbbind_dataset/MD_auto_workdir
  • # 总控脚本去除了 第一步的高斯优化
  • # 总控脚本注释了 最后一步的预平衡,改为手动提交
  • # 预平衡脚本调用3个GPU
  • source ~/zzy/gmx2024.4-gpu.sh
  • export OMP_NUM_THREADS=10
  • export CUDA_VISIBLE_DEVICES=0,1,2

  • # v100上 3块GPU,一次只能交3个任务
  • for i in {1..3};do cp -r ../clean_system/system${i} ./;cp -r ../mdp/ system${i};done

  • # 0530 修改了 amber_to_gmx-add_restraint.py 后解决了同源二聚体位置限制 超出index的问题
  • python total_control-v2.py 1
  • # 成功完成
  • # npt3.gro 检查无误

整理结果

  • # 85.9 /home/databank/zzy/project/koff/pdbbind_dataset/MD_auto_finished
  • # 编写了结果处理脚本,将 MD_auto_workdir 里的所有输出文件都删除/转移
  • # 在确认体系没问题的情况下,可以直接运行,整理结果
  • sh do.sh