2.22 思路整理

2025 1月初

开始做HSP90 体系的SMD模拟,用的师姐的给的8个体系,这8个体系koff和kd相关性较差。
后来SMD模拟后,fmax和koff没啥相关性,但是去掉两个体系后,fmax和koff相关性很好,与kd没什么相关性。但此时忽略了一个点:去掉两个体系后,剩余6个体系koff与kd 各自取对数后,也有了一定的相关性(R2=0.6)

2025-1-10 至 2025-1-20

由于1月初的结果,我们有了往下做的信心, 当时的想法是:想尝试一下用有同一批次的koff数据的体系来做SMD模拟,这样的数据的质量更高?这个时候还系统的统计了每个koff数据对应的蛋白是突变体还是野生型
上述工作的成果是基于文献,整理了35个HSP90的体系(都有晶体结构),其中符合同一批次且明确说了koff实验数据用的蛋白是野生型还是突变体的就只有6个,所以根据这6个体系去进行了SMD模拟
这个实验有几个不足:
  1. 没有检查者6个体系的相关性:他们的koff-kd相关性高达0.82!取对数后相关性也有0.7
  2. (zzy)体系太少了,6个体系,这个时候一个离群点对相关性的影响太大

2025-2-17 至 2-22(寒假后)

当时没整理HSP90的数据,印象里感觉结论还行,准备新体系又是舒适区,就接着做HIV-1体系的SMD,想看看koff和Fmax的相关性
这个体系首先蛋白是个二聚体,又缺少复合物晶体结构,所以在选择体系后,首要问题就是怎么获得复合物初始构象
17-18号和师姐挑了7个体系,这7个体系的koff-kd相关性很差,但是取对数后,相关性高达0.66。当时并未意识到要检查实验值取对数后的相关性,就继续向下做了
7个体系中,两个是有晶体结构的,前期体系已经准备好了
其余的5个体系,计划了三套初始构象获取方法:
  1. smina对接
  2. hermite constraint dock
  3. 上述两个方法后再跑CMD至平衡
CMD耗时比较久,作为方法发展,在流程里加入这一步会大大延缓效率
综合考虑后,作为universal的方法,流程如下: