Reference
-2025-10-28:最新的D3pockets的druggability的参考是:
Computational design of allosteric pathways reprograms ligand-selective GPCR signaling( https://doi.org/10.1101/2025.08.13.670154)
-2025-10-16计算方法调研总结:
MetaPocket 2.0等几何方法的预测成功率超过74%,表面积计算(Predicting druggable binding sites at the protein–protein interface)
PocketDepth算法通过几何分析和基于深度的聚类识别配体结合位点,在PDBbind数据集(1091个蛋白质)测试中,预测准确率达77%("deeper"参数)和95.8%("surface"参数)(PocketDepth: A new depth based algorithm for identification of ligand binding sites in proteins)
旅行深度(Travel Depth):定义为溶剂分子从表面点到参考表面的物理距离,适用于任何大小和复杂性的口袋(Travel Depth, a New Shape Descriptor for
Macromolecules: Application to Ligand Binding)
Epock,体积计算(Epock: rapid analysis of protein pocket dynamics)
AI-driven protein pocket detection:通过整合深度Q网络(deep Q-networks)进行结构分析,能够识别传统计算方法难以发现的隐秘口袋
除了体积、表面积、深度、疏水性和静电势等描述量之外,蛋白质结合口袋的描述还可以通过其他多种参数进行,这些参数进一步丰富了我们对口袋特性及其与配体相互作用机制的理解。这些额外的描述量可以从不同维度捕捉口袋的复杂性,例如形状、柔性、可成药性以及与配体结合的动态过程等。
### 1. 形状描述符(Shape Descriptors)
结合口袋的形状对于配体的识别和结合特异性至关重要。除了基本的几何参数外,更复杂的形状描述符能够提供更精细的口袋结构信息。
* **凹凸性(Convexity/Concavity)**:口袋的凹凸程度影响配体的进入和结合方式。高度凹陷的口袋通常具有更高的结合特异性。Reeb图(Reeb graph)是一种用于描述形状拓扑的工具,它可以被用来分析蛋白质口袋及其内部子口袋的凹凸结构,这对于理解多个配体在同一大口袋中的协同结合至关重要(Zhao et al., 2018)。
* **球谐函数展开(Spherical Harmonic Expansion, SHE)**:这是一种将三维形状(如蛋白质结合口袋或配体)分解为一系列数学函数的数学方法。通过计算这些函数的系数,可以获得一个紧凑且对旋转和平移不变的形状描述符,用于蛋白质结合口袋和配体的形状比较与分类(Morris et al., 2005)。这种方法在没有生化表征的蛋白质结构分析中尤为重要,有助于通过形状相似性推断蛋白质功能(Morris et al., 2005)。
* **截面形状(Cross-sectional Shape)**:口袋在不同深度的截面形状可以揭示口袋内部结构的变化,这对于设计能够与口袋特定区域相互作用的配体很有用。
### 2. 柔性与动态性(Flexibility and Dynamics)
蛋白质结合口袋并非静态结构,而是在分子动力学模拟中表现出显著的构象柔性(Stank et al., 2016)。这种动态性对于配体结合的特异性和亲和力至关重要,特别是“隐秘口袋”(cryptic pockets)的发现,即在没有配体结合时可能不明显但在结合过程中出现的口袋。
* **构象熵(Conformational Entropy)**:衡量口袋在不同构象状态下的自由度或无序程度。高构象熵可能意味着口袋具有更强的适应性,能够容纳多种配体或在结合时发生显著的构象变化(Stank et al., 2016)。
* **动态体积/形状变化(Dynamic Volume/Shape Change)**:通过分子动力学模拟,可以监测口袋体积和形状随时间的变化。例如,Epock工具可以高效地从分子动力学轨迹中计算口袋体积(Laurent et al., 2014)。最近的研究也开发了基于子口袋的分析方法,以更好地处理动力学弛豫过程中口袋信息的复杂性和多样性(Lv & Cao, 2024)。
* **水分子网络(Water Networks)**:结合口袋内及周围的水分子在配体结合过程中扮演着重要角色。它们可能形成稳定的水桥,促进或阻碍配体结合,或在配体结合时被取代。分析水分子在口袋中的位置、动力学和能量贡献可以提供配体结合机制的深入见解。
### 3. 可成药性(Druggability)
可成药性是评估一个蛋白质结合口袋是否适合作为药物靶点的关键指标,它综合了口袋的几何和化学特性。
* **成药性评分(Druggability Score)**:多种算法和工具被开发用于预测口袋的成药性,通常基于口袋的大小、形状、极性、疏水性、凹凸性以及是否存在某些关键残基等因素。例如,PockDrug等工具会综合考虑这些因素来评估口袋作为药物靶点的潜力。
* **药物样密度(Drug-like Density, DLID)**:通过分析大量已知药物结合口袋的特征,可以总结出与药物结合相关的口袋特征模式。DLID等指标可以量化口袋与已知药物分子结合位点的相似程度,从而预测其结合药物分子的可能性(Krivák & Hoksza, 2015)。
* **片段结合倾向(Fragment Binding Propensity)**:通过计算小分子片段(如甲醇、乙醇、苯等)在口袋内的结合亲和力,可以评估口袋的通用结合能力和其在片段筛选中的潜力。
### 4. 拓扑与连通性(Topology and Connectivity)
口袋的内部结构及其与蛋白质外部环境的连接方式也对配体结合有重要影响。
* **通道/隧道(Channels/Tunnels)**:有些酶的活性位点深埋在蛋白质内部,通过狭窄的通道与外部环境连接。分析这些通道的几何特性(如长度、直径、弯曲度)对于理解配体或产物的传输至关重要。
* **子口袋(Sub-pockets)**:一个大的结合口袋可能由多个相互连接的子口袋组成。识别和表征这些子口袋的结构和相互作用有助于理解多配体结合或变构调节机制(Zhao et al., 2018)。例如,SplitPocket通过Alpha Shape理论识别被配体分割的口袋来揭示蛋白质的功能表面(Tseng et al., 2009)。
### 5. 能量学特性(Energetic Properties)
除了静电势,还有其他能量学参数可以描述口袋与配体相互作用的潜力。
* **范德华势(Van der Waals Potential)**:描述口袋与配体之间非极性相互作用的强度。
* **氢键供体/受体密度(Hydrogen Bond Donor/Acceptor Density)**:口袋内部氢键供体和受体的分布密度,影响配体形成氢键的能力。
* **配体效率指数(Ligand Efficiency Metrics)**:尽管这些通常用于描述配体,但也可以从口袋的角度反推,例如,评估口袋大小与结合能之间的关系。
### 研究工具和计算公式
针对上述描述量,除了先前提到的一些工具(如CASTp(Liang et al., 1998)、Epock(Laurent et al., 2014)、fpocket(Kochnev & Durrant, 2022)、SplitPocket(Tseng et al., 2009)等),还有一些更广泛的计算方法和平台:
* **几何和形状分析工具**:
* **PocketMeasure**:用于计算口袋的几何参数,如体积、表面积、深度和形状描述符。
* **ProShape**:利用几何方法分析口袋的形状和拓扑结构。
* **SiteMap (Schrödinger)**:一个商业软件,提供全面的结合位点分析,包括几何、物理化学和成药性评估。
* **Surflex-Dock (Tripos)**:在对接过程中会生成一种“protomol”(原型分子),这可以被视为对口袋形状和特征的描述。
* **柔性与动态性分析**:
* **分子动力学模拟软件(如GROMACS, AMBER, NAMD)**:通过长时间尺度的模拟,可以捕捉蛋白质口袋的构象变化,进而分析动态体积、形状和构象熵(Stank et al., 2016)。这些模拟的数据可以与Epock等工具结合使用进行分析(Laurent et al., 2014)。
* **MDpocket**:一个用于在分子动力学模拟轨迹中识别和跟踪口袋的工具。
* **化学性质和成药性评估工具**:
* **FTMap**:通过使用小分子探针扫描蛋白质表面,识别配体结合的热点区域,提供关于口袋的化学性质和结合倾向信息。
* **PockDrug**:通过机器学习方法预测口袋的成药性,整合了多种几何和物理化学描述符。
* **SiteMap (Schrödinger)**:再次提及,它提供了详细的疏水性、极性、氢键潜力等化学环境分析。
* **QSCD(Quantized Surface Complementarity Diversity)**:通过量化表面互补性多样性来定义分子多样性,并能将蛋白质口袋映射到理论目标表面,从而根据形状和功能互补性对口袋进行分类(Mason et al., 2004)。
* **机器学习与深度学习平台**:
* **AI-driven pocket detection tools**:例如,一些整合了深度Q网络(deep Q-networks)的工具,能够识别传统方法难以发现的隐秘口袋。这些方法通常不依赖于单一的计算公式,而是通过训练模型从大量数据中学习口袋的复杂特征(Krivák & Hoksza, 2015)。
* **球形卷积神经网络(Spherical Convolutional Neural Network)**:已被应用于蛋白质结合位点分类,这表明深度学习在处理复杂三维结构特征方面具有巨大潜力(Morris et al., 2005)。
这些描述量和工具共同构建了一个多维度、多尺度的蛋白质结合口袋分析框架,使得研究人员能够更全面、更深入地理解蛋白质功能,并为药物设计提供更精准的指导(Mitra & Alexov, 2012)。特别是随着计算能力的增强和人工智能技术的发展,未来对蛋白质结合口袋的描述将更加精细化和智能化。
