8sys cluster

使用每个体系的关键氨基酸二面角作为feather来聚类

10us 轨迹合并

为方便聚类,将8个体系优先合并为10us
  • 75.2 /home/databank/MD_traj_dataset/D3PM/analysis/cluster_com_top1_redock_suceess/10us_pbc_trjcat

聚类

计划是使用每个体系的关键氨基酸二面角作为feather
要先去看每个体系apo/complex中最大差异氨基酸,看看用哪个二面角合适
  • # 要检查关键氨基酸在MD轨迹中的真实index,要将tleap生成的pdb/gmx复制过来,和原始pdb对比
  • 75.2 /home/databank/MD_traj_dataset/D3PM/analysis/cluster_com_top1_redock_suceess/pkt_feather/check_key_res
check 的流程如下:
  1. 检查晶体结构中apo/complex中关键氨基酸的默认二面角(C-CA-CB-CG)是否差异明显,足够表征它的取向(若可以,则可跳过步骤3);
  2. 到 tleap输出的pdb里找这个氨基酸的index(这个氨基酸的构象应当与apo晶体结构完全叠合);
  3. 到gmx.gro里检查氨基酸的原子名称,确定二面角原子;
  4. 信息录入index
  • /home/databank/MD_traj_dataset/D3PM/analysis/cluster_com_top1_redock_suceess/pkt_feather/index
  • 75.2 /home/databank/MD_traj_dataset/D3PM/analysis/cluster_com_top1_redock_suceess/pkt_feather
脚本实现了从index中读取体系信息:名称、文件路劲,关键氨基酸,二面角原子。
从而实现for循环依次提交任务

redock

  • 75.2 /home/databank/MD_traj_dataset/D3PM/analysis/cluster_com_top1_redock_suceess/redock
运行脚本 do.sh,实现以下步骤:
  1. 将 apo crystal 进行redock,将结果与 配体晶体结构的rmsd,打分进行记录
  2. 将聚类结果复制到体系文件夹,命名格式为 apo_traj_repcX/raw/apo4-4YZ1/exp10_c0.pdb
  3. 在上级 目录 apo_traj_repcX 内创建体系文件夹,将聚类的蛋白结构叠合至apo 晶体结构上。结果为 apo_traj_repcX/apo4-4YZ1/aligned_exp1_c0.pdb
  4. 将 aligned_exp1_c0.pdb 作为受体,进行redock,记录配体晶体结构的rmsd,打分
文件如下:
放大