MD auto 相关注意事项

MD auto 更新日记

2025-5-29

修改 atom_name_check.py 
解决当氢原子穿插出现在 SDF 文件中时不能正确匹配和更新非氢原子的坐标的问题

现有版本的注意事项

version 2025-5-29
  • 75.2 /home/databank/MD_traj_dataset/MD-automation/example/scripts-clean
  • 无法处理二硫键
  • 无法处理非标准氨基酸
  • 需要输入的蛋白(配体)结构文件结构准确(无缺链)质子化状态明确,否则Amber参数生成(md_parm_gen.py)会报错
  • 力场不支持的离子(如硫酸根离子)需要自己拟合作为输入文件(prep,frcmod)
  • 配体高斯优化(lig_parameter_cal.py)只接受sdf文件为输入(其他格式电荷信息会提取出错)
  • 配体高斯优化(lig_parameter_cal.py)不进行排队,工作路径下的文件夹数量有限制(见下文)
  • amber_to_gmx-add_restraint.py 无法对多链体系施加合理的位置限制
  • 预平衡(pre_equ.py)运行完成后无法自动退出
  • 预平衡(pre_equ.py)无法进行任务排队,超出用户定义GPU数量之外的体系将不会被处理,目前一台服务器上最多有8块GPU(75.3),换言之,该流程目前最多同时处理8个体系,远小于上文提到的高斯优化体系数量限制(一个体系4核,需要确保调用的总核数不超过服务器空闲核数)

开展MD数据集外课题需要的注意点

确认力场

常用的是ff14SB+TIP3P+Gaff2
根据自己的需要进行修改,修改方方法为进入 md_parm_gen.py 进行文本操作
如:1,$s/ff19SB/ff14SB/g 

确认预平衡参数

修改mdp文件

温度

nvt.mdp & npt.mdp: ref_t , gen_temp 两个参数
300K?310K?其他?

压缩系数

npt.mdp: compressibility 参数
需要根据温度进行修改

输出trr文件

nstxout & nstvout & nstfout: 多少步输出一次 坐标/速度/受力 信息 到 trr文件
若不需要输出trr,这三个参数不写(默认为0,即不输出),同时检查 nstxout-compressed 参数(多少步输出一次坐标信息到xtc文件中)
是否输出trr文件取决于该模拟体系是否需要并入课题组构建的MD数据集(后续可能用于Deep learning)
跟老师们确认

确认长时间模拟参数

!预平衡需要确认的参数这里都要确认!
!仔细检查模拟时长!