性能测试

速度测试

该部分只考虑速度,performance是唯一评判标准
1)与GMX标准REMD相比,vsREMD_GPU的耗时
测试方案:准备3个不同大小体系,6副本,各副本1ns,测试性能,尝试交换频率设置为50(-replex 50),温度300-450K
测试硬件:4090,4块4090,64CPU
测试软件:GMX-2022.5-GPU,vsREMD_GPU_wang, vsREMD_GPU_zjhan
评估标准:Performance

体系准备

  • # /home/data/zzy/koff/gmx-test/sys
  • # 每个体系都是6个副本(副本之间初始构象一样),一摸一样的温度梯度

  • # 准备mdp文件
  • # /home/data/zzy/koff/gmx-test/sys/mdp
  • for a in {0..5};do b=$((a + 1));c=`sed -n "${b}p" ../temp`;sed "s/+++/$c/g" ../run_template.mdp >md${a}.mdp;done

  • # 生成tpr
  • bash do.sh
  • ################# "do.sh" 12L, 179B #########################################################
  • for i in `cat index`
  • do
  • cd $i
  • for b in {0..5}
  • do
  • a=$((b + 1))
  • mkdir md${a}
  • gmx_mpi grompp -f ../mdp/md${b}.mdp -c npt.gro -p gmx.top -o md${a}/md.tpr -maxwarn 1
  • done
  • cd ../
  • done
  • #############################################################################################

remd

  • 4090 /home/data/zzy/koff/gmx-test/performance_speed/remd
  • # 把体系复制过来
  • cp ../../sys/index ./
  • for i in `cat index`;do cp -r ../../sys/$i ./;done
  • rm */*

  • cp ../../sys-replex1000/index ./
  • for i in `cat index`;do cp -r ../../sys-replex1000/$i ./;done
  • rm */*


  • # 调用2022版本gmx (remd)
  • source ~/.gmx-2022.5-GPU.sh

  • # 调用openmpi
  • export PATH=/home/data/zzy/software/openmpi/openmpi-5.0.5/bin:$PATH
  • export LD_LIBRARY_PATH=/home/data/zzy/software/openmpi/openmpi-5.0.5/lib:$LD_LIBRARY_PATH

  • # 2024-11-07 空着 3块GPU,留一块给锦添师姐
  • export CUDA_VISIBLE_DEVICES=2,3
  • export OMP_NUM_THREADS=8

  • # 测试参数:1ns / -replex 50 或者 1000 / 6个进程 / 6N个线程 
  • ######## "remd.sh" 5L, 121B ################################################################
  • for i in `cat index`
  • do
  • cd $i
  • # mpirun -np 6 gmx_mpi mdrun -v -deffnm md -multidir md1 md2 md3 md4 md5 md6 -replex 50
  • mpirun -np 6 gmx_mpi mdrun -v -deffnm md -multidir md1 md2 md3 md4 md5 md6 -replex 50 -ntomp 6
  • done
  • ###########################################################################################
  • GROMACS (2019.3 GPU版) 并行效率测试及调试思路 - 分子模拟 (Molecular Modeling) - 计算化学公社

  • dddc@gpu-4090:/home/data/zzy/koff/gmx-test/performance_speed/remd-test2-replex1000$ nohup sh remd.sh &
  • [1] 1325340

11.8 GPU-REMD速度测试

  • 172.21.75.1 /home/data/zzy/koff/gmx-test/performance_speed/remd-test3-replex1000
  • 测试参数:
  • 模拟时间:500ps (1ns 高温副本体系崩溃了)
  • 尝试交换的步数(-replex):1000
  • 副本数:6
  • 温度梯度:300.00, 326.39, 355.41, 386.27, 420.23, 450.00
  • 提交任务的命令:mpirun -np 6 gmx_mpi mdrun -v -deffnm md -multidir md1 md2 md3 md4 md5 md6 -replex 1000 -ntomp 8
  • 测试结果:

  • # 提交任务的命令有问题,测试不同命令效果:
  • 1.
  • mpirun -np 6 gmx_mpi mdrun -v -deffnm md -multidir md1 md2 md3 md4 md5 md6 -replex 1000