发布时间:2019-10-10 14:12 原文链接: JCIM:计算提升蛋白质蛋白质相互作用的预测精度

  蛋白质-蛋白质相互作用和识别在生物学过程中有着非常重要的作用。尽管结构生物学已经取得了较大的进展,但直接采用实验方法确定蛋白质-蛋白质复合物结构仍然非常困难。分子对接技术是预测蛋白质-蛋白质复合物结构的有效方法。蛋白质-小分子之间的相互作用一般蛋白质受体有结合口袋,相互作用区域比较明确,而蛋白质-蛋白质相互作用则有可能发生在两个蛋白质表面上任何区域。因此,蛋白质-蛋白质相互作用的预测,需要对蛋白质表面进行全局且充分的搜索,然而全局搜索计算非常耗时。快速傅里叶变换方法(fast Fourier transform, FFT)是蛋白质-蛋白质对接中应用最广泛的搜索方法,因为该方法可以对蛋白质表面的互补情况进行充分且高效的全局搜索。为了推进蛋白质-蛋白质复合物结构预测的发展,欧洲生物信息学中心从2001年开始举办CAPRI预测竞赛(Critical Assessment of PRedicted Interactions),采用尚未公开发表的蛋白质-蛋白质复合物结构对不同课题组的预测方法进行测试。

  尽管CAPRI预测竞赛已经取得了较大进展,但基于FFT全局搜索的蛋白质-蛋白质分子对接方法仍然存在一些明显的局限性。首先,任何原子对打分函数,如原子对接触势能,必须定义成相关函数的形式才可以采用FFT方法计算。因此,更精确的距离相关(distance-dependent)原子对打分函数,则难以表示成相关函数形式,从而也限制了精确打分函数在FFT方法中的应用。其次,指定结合位点的分子对接对于提高蛋白质-蛋白质分子对接的准确性非常重要,但位点约束条件也不容易写成相关函数形式。因此,很少有基于FFT方法的蛋白质-蛋白质分子对接程序能够在全局搜索中加入残基位点约束条件。第三,FFT全局搜索中使用的打分函数,一般基于晶体结构进行训练,这些打分函数对于蛋白质结构的微小变化非常敏感。因此,很多FFT对接方法在结合态(Bound)表现较好,而对于更接近真实情况的自由态(UnBound)对接,则因为蛋白质结构柔性变化而无法预测得到正确复合物构象。因此,有必要改进传统的FFT全局搜索策略,发展能够同时实现全局搜索、精确打分和位点约束的蛋白质-蛋白质对接方法。

图片.png

图1. CoDockPP程序流程图

  基于FFT的蛋白质-蛋白质对接方法会产生~1010个复合物构象,但传统的方法仅保留了103-104个构象进行后续精确评分。因此,大量正确的复合物构象在初始阶段就已经被排除掉了。常珊课题组建议了一种新的基于FFT的蛋白质-蛋白质对接方法CoDockPP(流程如图1),服务器的网址是http://codockpp.schanglab.org.cn。该方法充分运用了FFT方法全局搜索的优点,选择了几何匹配较好的对接复合物构象。搜索初期保留了任何有表面接触的复合物构象,大约108个构象到下一步。这样可以确保正确的复合物构象进入后续的精确评分。同时,复合物构象被转化到笛卡尔坐标空间。为了加速计算,应用位点约束信息和快速查表的原子对打分函数,在保证一定精度的前提下逐渐减低候选复合物构象数量(~105)。最后,候选复合物构象进一步通过精确的距离相关原子对打分函数进行排序。CoDockPP程序在benchmark 5.0上进行测试,与ZDOCK程序进行全局分子对接的比较,与RosettaDock程序进行指定位点分子对接的比较。测试比较发现,CoDockPP程序均能显着改进了成功率和准确预测的数量。特别是在构象变化比较大的困难(difficult)体系上,CoDockPP程序仍然能够在Top10中准确预测出近天然复合物构象(图2)。论文发表在2019年第8期的Journal of Chemical Information and Modeling杂志上。

图片.png

图2. CoDockPP程序在构象变化比较大的困难(difficult)体系上(PDB依次为1EER, 2IDO, 3F1P和3L89)表现较好。黄色和蓝色表示复合物晶体结构中的受体蛋白质和配体蛋白质。粉红色表示CoDockPP预测的Top10中最佳的配体蛋白质结构。

  为了推动蛋白质多聚体复合物结构的预测,从2014年开始,CAPRI组委会与著名的蛋白质结构预测CASP(Critical Assessment of protein Structure Prediction)组委会共同组织了联合竞赛。在最新的CASP-CAPRI联合竞赛中,常珊课题组的CoDock团队获得CASP+CAPRI整体排名第8,CAPRI参赛组排名第4的好成绩。特别是在困难(Hard)类型预测中CoDock表现突出,排名第1(图3,排名截图自CASP评估官网http://predictioncenter.org/casp13/zscores_multimer.cgi)。

  2019年4月,CAPRI组委会在英国剑桥大学举办了第七届CAPRI评估会,此次评估会上谷歌公司的DeepMind团队介绍了AlphaFold程序在蛋白质单体结构预测中表现。常珊课题组也受邀参加了此次评估会,是特邀口头报告中唯一的中国团队,课题组主要介绍CoDock团队在CAPRI预测竞赛中的表现,并获得了CAPRI组委会的肯定。

图片.png

图3. CASP-CAPRI联合竞赛中,困难(Hard)类型预测CoDock团队排名第1

  发表论文和链接:

  [1] Kong R, Wang F, Zhang J, Xu X J, Chang S. CoDockPP: a multistage approach for global and site-specific protein-protein docking. Journal of Chemical Information and Modeling. 2019, 59(8): 3556-3564.

  https://pubs.acs.org/doi/10.1021/acs.jcim.9b00445


相关文章

Nature子刊:AI像造句一样设计人工蛋白质

近年来,人工智能(AI)已在医学、生物学及制药领域中展示出广阔的发展前景。特别是在蛋白质设计和工程领域,基于AI技术创建人工的蛋白质序列已经成为现实,并可能被用于治疗各种疾病。日前,来自AI研究企业S......

Nature:柳振峰团队发现叶绿体蛋白质传送器的组装原理

叶绿体是植物和藻类细胞中可以通过光合作用将光能转化为化学能的细胞器。作为一种由两层膜包被的特殊细胞器,叶绿体含有其自身的基因组,其表达是与核基因组的表达紧密协调的。叶绿体的蛋白质有两种来源,有一小部分......

JACS|大连化物所:基于nMS表征影响蛋白质结构的分子机制

近日,连化物所生物分子结构表征新方法研究组(1822组)王方军研究员、刘哲益副研究员团队与西南交通大学封顺教授团队合作,利用我所自主搭建的高能紫外激光解离—串联质谱仪器,揭示了质子化氨基酸侧链的正电荷......

新算法可生成蛋白质5D图像揭示微小尺度下的生物学过程

美国圣路易斯华盛顿大学科研团队开发出一种机器学习算法Deep-SMOLM,可生成蛋白质5D图像,包括单个分子的方向和位置等信息。实验室的单分子成像经常存在因包含“斑点”或波动等情况导致图像模糊的问题,......

动植物跨界医疗模式新突破|动物体内成功植入光合系统

细胞的合成代谢需要消耗足够的腺嘌呤核苷三磷酸(ATP)和烟酰胺腺嘌呤二核苷酸(NADPH),而这些关键因子在病理条件下往往不足。在生命科学和临床医学的前沿探索中,一个巨大的挑战就是如何向退行性变及损伤......

研究发现叶绿体蛋白质传送器的组装原理

叶绿体是植物和藻类细胞中可以通过光合作用将光能转化为化学能的细胞器。作为一种由两层膜包被的特殊细胞器,叶绿体含有自身的基因组,且其表达是与核基因组的表达紧密协调的。叶绿体的蛋白质有两种来源,有一小部分......

柳振峰课题组等发现叶绿体蛋白质传送器的组装原理

叶绿体是植物和藻类细胞中可以通过光合作用将光能转化为化学能的细胞器。作为一种由两层膜包被的特殊细胞器,叶绿体含有自身的基因组,且其表达是与核基因组的表达紧密协调的。叶绿体的蛋白质有两种来源,有一小部分......

我国科学家首创蛋白质动态结构AI建模方法

科技日报记者刘园园西湖大学12月8日公布,该校人工智能(AI)讲席教授李子青团队与厦门大学、德睿智药合作,首创研发了能够刻画蛋白质构象变化与亲和力预测的AI模型——ProtMD。这是第一个尝试解析蛋白......

磷酸化修饰蛋白质组学共性关键技术研究获突破

近日,广东省农业科学院农业生物基因研究中心晏石娟团队联合加拿大约克大学、德国马普分子植物生理研究所等研究人员在磷酸化修饰蛋白质组学共性关键技术研发方面取得重大突破,首次搭建全自动在线磷酸化蛋白质组学分......

蛋白质形状有助检测帕金森病

瑞士苏黎世联邦理工学院的科学家们发现,健康人士和帕金森病患者脊髓液中一组蛋白质的形状不同,这些蛋白质有望用作检测帕金森病的新型生物标记物。相关研究刊发于最新一期《自然·结构与分子生物学》杂志。许多人类......