药物结合口袋的动态行为与成药性研究

没别的意思就是开题的题目
旧策略:
1.成药蛋白[p1,p2,...,pn] n现在是70
2.对pi,对应一个pdbid,转换为uniprotid 
确认晶体结构中是否包含:蛋白结构+药物结构,其中药物结构对应于drugbank中的药物结构。
3.在药物/配体分子生成口袋preal
4.遍历d3pockets的计算结果,计算 rmsd(preal,pj),pj ∈ pi。返回match_results { pj: rmsd}
选取阈值 rmsdupper,将match_results划分为 druggable_pockets(dp)[pm],undruggable_pockets(udp)[po]
5.遍历统计量列表[ volume,surface area,...,],对每个计算不同的量
产生dp_statistics:{ pm: (volume,surface_area,...,)}
udp_statistics:{po:(volume,surface_area,...,)}
6.完成所有成药蛋白的统计量计算,然后分别对每个统计量进行可视化
volume: 用比体积可视化,横坐标是蛋白序号(默认按照pdbid排序),纵坐标是比体积
mean(dp_statistics.volume)/mean(udp_statistics.volume)
surface_area:同上,用比表面积
增加两个统计量:
deepth
hydrophobic
electronic potential
新策略:
1.成药蛋白[p1,p2,...,pn] n=41,经过检查,此前有investigational药物被列入到approval中的。
2.pass
研究思路:
基于配体的一个思路就是,对于有药物配体的蛋白生成一个实际口袋,然后找到一个特征近乎相同的口袋,然后比较这两个口袋其他特征,就能发现为什么药物会结合在实际口袋位置,其中的关键特征因素是什么?我愿称之为单因素归一的差异比对。当然,这个可以是对同一个蛋白进行,也可以泛靶点蛋白。这里我们需要一个新的数据库:D3pockets
特征计算算法:
体积:凸包计算
表面积:pymol自带get_area
深度:最大质心距离
疏水性:Kyte-Doolittle氨基酸疏水性标度
静电势:原子部分电荷平均值
照强师兄的成药的蛋白:
'1A4G', '1HPK', '1HPV', '1HWK', '1HZE', '1IHI', '1ITU', '1J3J', '1J8U', '1JKH',
            '1JR1', '1JU6', '1K4T', '1KVL', '1MRL', '1NB9', '1NHZ', '1OHR', '1QKN', '1QYX',
            '1S2Y', '1T46', '1UDT', '1Y0X', '1Z95', '1ZUC', '2AB2', '2F94', '2GQG', '2OCF',
            '2P16', '2VDM', '2W4X', '2WGJ', '2YDO', '3B6R', '3C6M', '3D91', '3FHX', '3G5D',
            '3G9E', '3GWX', '3H0A', '3HS4', '3L4W', '3ML5', '3MZE', '3N23', '3PYY', '3QEL',
            '3RUK', '3S7S', '3TIC', '3TVX', '4ANQ', '4C2P', '4DRI', '4EY7', '4G5J', '4HFP',
            '4LU3', '4LXZ', '4MS4', '4O2B', '4PE5', '4TZU', '4XV2','3G8I', '4BDS', '4U15', '3G0B', '4LNX', '3VW7', '1PK2' #实际上只有74唯一的
 75.2~D3pockets/analysis/query_specific_pdbids.py 
 成功连接到MySQL数据库
找到 35 条匹配记录
匹配的pdbid列表: 1a4g, 1hpv, 1jr1, 1nhz, 1ohr, 1qkn, 1t46, 1udt, 1y0x, 1z95, 1zuc, 2f94, 2p16, 2w4x, 2wgj, 2ydo, 3d91, 3g0b, 3g5d, 3g8i, 3g9e, 3h0a, 3hs4, 3ml5, 3n23, 3pyy, 3qel, 3tic, 3tvx, 3vw7, 4anq, 4bds, 4hfp, 4lxz, 4xv2
结果已保存到 specific_pdbids_report.csv
数据库连接已关闭
pdbidchainsource
1a4gZMISATO
1hpvZMISATO
1jr1ZMISATO
1nhzZMISATO
1ohrZMISATO
1qknZMISATO
1t46ZMISATO
1udtZMISATO
1y0xZMISATO
1z95ZMISATO
1zucZMISATO
2f94ZMISATO
2p16ZMISATO
2w4xZMISATO
2wgjZMISATO
2ydoZMISATO
3d91ZMISATO
3g0bZMISATO
3g5dZMISATO
3g8iZMISATO
3g9eZMISATO
3h0aZMISATO
3hs4ZMISATO
3ml5ZMISATO
3n23ZMISATO
3pyyZMISATO
3qelZMISATO
3ticZMISATO
3tvxZMISATO
3vw7ZMISATO
4anqZMISATO
4bdsZMISATO
4hfpZMISATO
4lxzZMISATO
4xv2ZMISATO
目前D3pockets中所有的成药蛋白:
75.2 ~D3pockets/analysis/python fetch_drug_targets.py 
python fetch_drug_targets.py 
结果:
开始获取审批通过药物的pdbid信息...
找到11861条药物pdbid记录
示例pdbid(前5个): ['5KCE', '4YZU', '5LG1', '1DGQ', '3H32']
找到4173条动力学模拟记录
示例动力学模拟pdbid(前5个): ['10gs', '11gs', '13gs', '1a07', '1a08']
成功匹配4173条记录
未匹配的pdbid数量: 20579
成功写入4173条记录到drug_target_matches.csv
找到368个不重复的uniprotid
目标比较性质:

生成口袋

  • python27ana /home/zqchen/D3Pockets_WEB_UCB/PyPocket_Detect.py -r test.pdb
生成口袋的atm和pit文件在同一个文件夹

生成静态性质

atm,pit以及原始的pdb需要在同一个文件夹下
  • python27ana /home/zqchen/D3Pockets_Descriptors/d3pockets_desciptors_rec.py -r test.pdb

输出结果

result_descriptors.txt
参数具体意义
1234567891011121314151617
ABCDEFGHIJK
列数参数名称参数意义参考资料
1recfile受体pdb
2pitfile口袋的格点文件
3volume口袋体积(立方埃)
4num_residue口袋的氨基酸数目
5second_H二级结构中的helix
6second_B二级结构中的beta-sheet
7asadssp计算的Relative   ASAhttps://biopython.org/DIST/docs/api/Bio.PDB.DSSP%27-module.html
8residue_depthResidue depth is the average distance of the atoms of a   residue from the solvent accessible surface.https://biopython.org/DIST/docs/api/Bio.PDB.ResidueDepth%27-module.html
9hydrophilic
10hydrophobic
11hydrophobic_half
12HSE_UPHalf-Sphere Exposurehttps://biopython.org/DIST/docs/api/Bio.PDB.HSExposure._AbstractHSExposure-class.html
13HSE_DOWNHalf-Sphere Exposurehttps://biopython.org/DIST/docs/api/Bio.PDB.HSExposure._AbstractHSExposure-class.html
14stable
15coverage