ProDy 简介
ProDy 工具由美国匹兹堡大学 Ivet Bahar 实验室 开发,用以基于结构的蛋白质动力学分析。 ProDy 是一个免费的开源 Python 软件包,它被设计为一种灵活的响应式 API ,适用于交互式使用和计算程序的开发,用户可以在 ProDy 官网 进行下载以及查阅使用手册。同时,在多年的发展进程中,ProDy 工具较最初的版本已增加了多种功能,可用于进行蛋白质动力学性质的更深入研究。
在发布 ProDy 工具的文献中,对该工具的功能和应用作了以下的表述:
ProDy allows for quantitative characterization of structural variations in heterogeneous datasets of structures experimentally resolved for a given biomolecular system, and for comparison of these variations with the theoretically predicted equilibrium dynamics. Datasets include structural ensembles for a given family or subfamily of proteins, their mutants and sequence homologues, in the presence/absence of their substrates, ligands or inhibitors. Numerous helper functions enable comparative analysis of experimental and theoretical data, and visualization of the principal changes in conformations that are accessible in different functional states.
Ahmet Bakan, Lidio M. Meireles, Ivet Bahar, ProDy: Protein Dynamics Inferred from Theory and Experiments, Bioinformatics, Volume 27, Issue 11, 1 June 2011, Pages 1575–1577, https://doi.org/10.1093/bioinformatics/btr168
简而言之,ProDy 最大的特点在于从理论和实验推断蛋白质的动力学性质,可以提供有关目标系统结构变异的信息,与理论模型和方法预测的内在动力学进行系统的比较,从而有助于深入了解结构、动力学和功能之间的关系。而 ProDy 的实现,则依靠于弹性网络模型(elastic network model,ENM)理论的提出。
MD 背景
分子动力学(Molecular Dynamics,MD)模拟是在原子水平上获取蛋白质微观运动过程的有效工具[1],然而,由于 MD 模拟非常耗时,利用 MD 模拟蛋白质功能性的大幅度构象运动还存在一定的困难。
20世纪80年代,Brooks[2]、Go[3]等发展了正则模式分析(Normal Mode Analysis,NMA) 方法并成功用于蛋白质运动模式的研究。NMA方法不需要进行长时间的动力学模拟就可以获得体系的构象运动性质,大大降低了计算量。但是,传统的 NMA 方法需要利用经典全原子力场对体系进行能量优化,如果能量优化不充分,结果会有很大的偏差,并且 NMA 的计算需要耗费较大的内存。
1996年,Tirion[4]对传统的全原子 NMA 方法进行了大幅度的简化,进一步降低了计算量。进而,蛋白质原子之间的相互作用简化为谐振势,用弹簧来代替,并且所有弹簧的强度系数都相同,忽略了不同原子间相互作用的强弱。
在此基础上,Bahar[5]、Hinsen[6]将 NMA 方法进行了进一步简化,提出了弹性网络模型(Elastic Network Model,ENM)。ENM 将蛋白质的每个残基简化为一个点,用其 Cα 来代替,残基之间的相互作用简化为谐振势,用弹簧来代替,并且所有弹簧的强度系数都相同。ENM 完全忽略了残基之间精细的相互作用,将传统原子层面的 NMA 方法简化到残基层面,大大降低了计算量和内存消耗。在 Bahar 等人所提出的模型中,残基在平衡位置附近的振动认为是各向同性的高斯运动,该模型称为高斯网络模型 (Gaussian Network Model,GNM)。GNM模型能够计算得到不同运动模式中各个残基的运动幅度,但是无法获得其运动的方向。
随后,Atilgan[7]将 GNM 进行了扩展,考虑了残基运动的方向性信息,将各向同性模型发展为各向异性模型,建立了各向异性网络模型(Anisotropic Network Model,ANM)。由于GNM和ANM计算简单快速,在蛋白质的变构过程、结合诱导的构象变化、蛋白复合物结合位点的预测和鉴定等蛋白质结构-功能关系研究中得到了广泛的应用,有利于深入了解蛋白内复合物之间的相互作用。
关于 NMA 正则模式分析的具体解释,找到了一篇较为详细的博客可供参考。
Reference:
[1] MCCAMMON J A,GELIN B R,KARPLUS M. Dynamics of folded proteins[J]. Nature,1977,267(5612) : 585-590.
[2]BROOKS B R,KARPLUS M.Harmonic dynamics of proteins: normal modes and fluctuations in bovine pancreatic trypsin inhibitor [J]. Proceedings of the National Academy of Sciences of the United States of America,1983,80(21) : 6571-6575.
[3] GO N,NOGUTI T,NISHIKAWA T. Dynamics of a small globular protein in terms of low-frequency vibrational m o d e s [J]. Proceedings of the National Academy of Sciences of the United States of America,1983,80(12) : 3696-3700.
[4] TIRION M M. Large amplitude elastic motions in proteins from a single-parameter,atomic analysis [J]. Physical Review Letters,1996,77(9) : 1905-1908.
[5] BAHAR I,ATILGAN A R,ERMAN B. Direct evaluation of thermal fluctuations in proteins using a single-parameter harmonic potential[J]. Folding and Design,1997,2( 3) :173-181.
[6] HINSEN K. Analysis of domain motions by approximate normal mode calculations[J]. Proteins,1998,33(3): 417-429.
[7] ATILGAN A R,DURELL S R,JERNIGAN R L,et al. Anisotropy of fluctuation dynamics of proteins with an elastic network model[J]. Biophysical Journal,2001,80 (1) :505-515.
ENM 的网络表征
弹性网络模型(Elastic Network Model,ENM) 作为获取蛋白质结构本身固有动力学性质,进而揭示其生物学功能的有效方法,在蛋白质结构-功能关系的研究中得到了广泛应用,其核心思想在于将蛋白质结构借助于网络进行表征,借助于网络模型的拓扑学性质并结合相关分析,从而得出一定的结论。关于为什么要使用网络模型,Ivet Bahar 实验室给出了如下的解释:
Why network models?
√ for large systems’ collective motions & long time processes beyond the capability of full atomic simulations
√ to incorporate structural data in the models – at multiple levels of resolution
√ to take advantage of theories developed in other disciplines: polymer physics, graph theory, spectral graph methods, etc.
ProDy 将 ENM 进行了实际的应用,有助于预测蛋白质的整体运动。尽管 ENM 是将每个残基简化为 Cα 来代替的粗粒度描述,残基对之间通过具有统一强度系数的弹性弹簧连接,但可以获得每个蛋白质体系运动频谱的独特分析结果。