药物结合口袋的动态行为与成药性研究
没别的意思就是开题的题目
旧策略:
1.成药蛋白[p1,p2,...,pn] n现在是70
2.对pi,对应一个pdbid,转换为uniprotid
确认晶体结构中是否包含:蛋白结构+药物结构,其中药物结构对应于drugbank中的药物结构。
3.在药物/配体分子生成口袋preal
4.遍历d3pockets的计算结果,计算 rmsd(preal,pj),pj ∈ pi。返回match_results { pj: rmsd}
选取阈值 rmsdupper,将match_results划分为 druggable_pockets(dp)[pm],undruggable_pockets(udp)[po]
5.遍历统计量列表[ volume,surface area,...,],对每个计算不同的量
产生dp_statistics:{ pm: (volume,surface_area,...,)}
udp_statistics:{po:(volume,surface_area,...,)}
6.完成所有成药蛋白的统计量计算,然后分别对每个统计量进行可视化
volume: 用比体积可视化,横坐标是蛋白序号(默认按照pdbid排序),纵坐标是比体积
mean(dp_statistics.volume)/mean(udp_statistics.volume)
surface_area:同上,用比表面积
增加两个统计量:
deepth
hydrophobic
electronic potential
新策略:
1.成药蛋白[p1,p2,...,pn] n=41,经过检查,此前有investigational药物被列入到approval中的。
2.pass
研究思路:
基于配体的一个思路就是,对于有药物配体的蛋白生成一个实际口袋,然后找到一个特征近乎相同的口袋,然后比较这两个口袋其他特征,就能发现为什么药物会结合在实际口袋位置,其中的关键特征因素是什么?我愿称之为单因素归一的差异比对。当然,这个可以是对同一个蛋白进行,也可以泛靶点蛋白。这里我们需要一个新的数据库:D3pockets
特征计算算法:
体积:凸包计算
表面积:pymol自带get_area
深度:最大质心距离
疏水性:Kyte-Doolittle氨基酸疏水性标度
静电势:原子部分电荷平均值
照强师兄的成药的蛋白:
'1A4G', '1HPK', '1HPV', '1HWK', '1HZE', '1IHI', '1ITU', '1J3J', '1J8U', '1JKH',
'1JR1', '1JU6', '1K4T', '1KVL', '1MRL', '1NB9', '1NHZ', '1OHR', '1QKN', '1QYX',
'1S2Y', '1T46', '1UDT', '1Y0X', '1Z95', '1ZUC', '2AB2', '2F94', '2GQG', '2OCF',
'2P16', '2VDM', '2W4X', '2WGJ', '2YDO', '3B6R', '3C6M', '3D91', '3FHX', '3G5D',
'3G9E', '3GWX', '3H0A', '3HS4', '3L4W', '3ML5', '3MZE', '3N23', '3PYY', '3QEL',
'3RUK', '3S7S', '3TIC', '3TVX', '4ANQ', '4C2P', '4DRI', '4EY7', '4G5J', '4HFP',
'4LU3', '4LXZ', '4MS4', '4O2B', '4PE5', '4TZU', '4XV2','3G8I', '4BDS', '4U15', '3G0B', '4LNX', '3VW7', '1PK2' #实际上只有74唯一的
75.2~D3pockets/analysis/query_specific_pdbids.py
成功连接到MySQL数据库
找到 35 条匹配记录
匹配的pdbid列表: 1a4g, 1hpv, 1jr1, 1nhz, 1ohr, 1qkn, 1t46, 1udt, 1y0x, 1z95, 1zuc, 2f94, 2p16, 2w4x, 2wgj, 2ydo, 3d91, 3g0b, 3g5d, 3g8i, 3g9e, 3h0a, 3hs4, 3ml5, 3n23, 3pyy, 3qel, 3tic, 3tvx, 3vw7, 4anq, 4bds, 4hfp, 4lxz, 4xv2
结果已保存到 specific_pdbids_report.csv
数据库连接已关闭
| pdbid | chain | source |
| 1a4g | Z | MISATO |
| 1hpv | Z | MISATO |
| 1jr1 | Z | MISATO |
| 1nhz | Z | MISATO |
| 1ohr | Z | MISATO |
| 1qkn | Z | MISATO |
| 1t46 | Z | MISATO |
| 1udt | Z | MISATO |
| 1y0x | Z | MISATO |
| 1z95 | Z | MISATO |
| 1zuc | Z | MISATO |
| 2f94 | Z | MISATO |
| 2p16 | Z | MISATO |
| 2w4x | Z | MISATO |
| 2wgj | Z | MISATO |
| 2ydo | Z | MISATO |
| 3d91 | Z | MISATO |
| 3g0b | Z | MISATO |
| 3g5d | Z | MISATO |
| 3g8i | Z | MISATO |
| 3g9e | Z | MISATO |
| 3h0a | Z | MISATO |
| 3hs4 | Z | MISATO |
| 3ml5 | Z | MISATO |
| 3n23 | Z | MISATO |
| 3pyy | Z | MISATO |
| 3qel | Z | MISATO |
| 3tic | Z | MISATO |
| 3tvx | Z | MISATO |
| 3vw7 | Z | MISATO |
| 4anq | Z | MISATO |
| 4bds | Z | MISATO |
| 4hfp | Z | MISATO |
| 4lxz | Z | MISATO |
| 4xv2 | Z | MISATO |
目前D3pockets中所有的成药蛋白:
75.2 ~D3pockets/analysis/python fetch_drug_targets.py
python fetch_drug_targets.py
结果:
开始获取审批通过药物的pdbid信息...
找到11861条药物pdbid记录
示例pdbid(前5个): ['5KCE', '4YZU', '5LG1', '1DGQ', '3H32']
找到4173条动力学模拟记录
示例动力学模拟pdbid(前5个): ['10gs', '11gs', '13gs', '1a07', '1a08']
成功匹配4173条记录
未匹配的pdbid数量: 20579
成功写入4173条记录到drug_target_matches.csv
找到368个不重复的uniprotid
目标比较性质:
生成口袋
- python27ana /home/zqchen/D3Pockets_WEB_UCB/PyPocket_Detect.py -r test.pdb
生成口袋的atm和pit文件在同一个文件夹
生成静态性质
atm,pit以及原始的pdb需要在同一个文件夹下
- python27ana /home/zqchen/D3Pockets_Descriptors/d3pockets_desciptors_rec.py -r test.pdb
输出结果
result_descriptors.txt
参数具体意义
1234567891011121314151617
ABCDEFGHIJK
| 列数 | 参数名称 | 参数意义 | 参考资料 | ||||||||
| 1 | recfile | 受体pdb | |||||||||
| 2 | pitfile | 口袋的格点文件 | |||||||||
| 3 | volume | 口袋体积(立方埃) | |||||||||
| 4 | num_residue | 口袋的氨基酸数目 | |||||||||
| 5 | second_H | 二级结构中的helix | |||||||||
| 6 | second_B | 二级结构中的beta-sheet | |||||||||
| 7 | asa | dssp计算的Relative ASA | https://biopython.org/DIST/docs/api/Bio.PDB.DSSP%27-module.html | ||||||||
| 8 | residue_depth | Residue depth is the average distance of the atoms of a residue from the solvent accessible surface. | https://biopython.org/DIST/docs/api/Bio.PDB.ResidueDepth%27-module.html | ||||||||
| 9 | hydrophilic | ||||||||||
| 10 | hydrophobic | ||||||||||
| 11 | hydrophobic_half | ||||||||||
| 12 | HSE_UP | Half-Sphere Exposure | https://biopython.org/DIST/docs/api/Bio.PDB.HSExposure._AbstractHSExposure-class.html | ||||||||
| 13 | HSE_DOWN | Half-Sphere Exposure | https://biopython.org/DIST/docs/api/Bio.PDB.HSExposure._AbstractHSExposure-class.html | ||||||||
| 14 | stable | ||||||||||
| 15 | coverage | ||||||||||
