发布时间:2020-09-07 21:41 原文链接: 蛋白质二级结构预测(proteinsecondarystructureprediction)

蛋白质二级结构的预测开始于20世纪60年代中期。二级结构预测的方法大体分为三代,第一代是基于单个氨基酸残基统计分析,从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。第二代预测方法是基于氨基酸片段的统计分析,使用大量的数据作为统计基础,统计的对象不再是单个氨基酸残基,而是氨基酸片段,片段的长度通常为11-21。片段体现了中心残基所处的环境。在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据。这些算法可以归为几类:(1)基于统计信息;(2)基于物理化学性质;(3)基于序列模式;(4)基于多层神经网络;(5)基于图论;(5)基于多元统计;(6)基于机器学习的专家规则;(7)最邻近算法。第一代和第二代预测方法有共同的缺陷,它们对三态预测的准确率都小于 70%,而对β折叠预测的准确率仅为28~48%,其主要原因是这些方法在进行二级结构预测时只利用局部信息,最多只用局部的20个残基的信息进行预测。二级结构预测的实验结果和晶体结构统计分析都表明,二级结构的形成并非完全由局域的序列片段决定,长程相互作用不容忽视。蛋白质的二级结构在一定程度上受远程残基的影响,尤其是β折叠。从理论上来说,局部信息仅包含二级结构信息的65%左右,因此,可以想象只用局部信息的二级结构预测方法,其准确率不会有太大的提高。

二级结构预测的第三代方法运用蛋白质序列的长程信息和蛋白质序列的进化信息,使二级结构预测的准确程度有了比较大的提高,特别是对β折叠的预测准确率有较大的提高,预测结果与实验观察趋于一致。一般75%的氨基酸残基可以被置换而不改变蛋白质的结构,然而有时改变几个关键的残基则可能导致破坏蛋白质的结构。这好像是两个矛盾的结论,但解释又非常简单。一个蛋白质在其进化过程中探查了每个位置上氨基酸可能的与不可能的变化,不可能变化的部分是进化保守区域。可变部分的变化不改变结构,而不可变部分的变化则改变蛋白质的结构,由此失去蛋白质原有的功能,因而也就难以延续下去。这些不可变部分体现了蛋白质功能对结构的特定要求。这样,从一个蛋白质家族中提取的残基替换模式高度反映了该家族特异的结构。通过序列的比对可以得到蛋白质序列的进化信息,得到蛋白质家族中的特定残基替换模式,此外,通过序列的比对也可以得到长程信息。

目前,许多二级结构预测的算法都是基于序列比对的,通过序列比对可以计算出目标序列(待预测其二级结构的序列)中每个氨基酸的保守程度。对于二级结构三态(α,β,none)预测准确率首先达到70%的方法是基于统计的神经网络方法PHDsec。PHDsec利用通过多重序列比对得到的进化信息作为神经网络的输入,另外采用了一个全局的描述子,即所有氨基酸组成(20种氨基酸中每个所占的比例)作为蛋白质序列的全局信息。这类算法预测的准确率能达到 70%至75%。各种方法预测的准确率随蛋白质类型的不同而变化。例如,一种预测方法在某些情况下预测的准确率能够达到90%,而在最差的情况下仅达到 50%,甚至更低。在实际应用中究竟使用那种方法,还需根据具体的情况。虽然二级结构预测的准确性有待提高,其预测结果仍然能提供许多结构信息,尤其是当一个蛋白质的真实结构尚未解出时更是如此。通过对多种方法预测结果的综合分析,再结合实验数据,往往可以提高预测的准确度。二级结构预测通常作为蛋白质空间结构预测的第一步。例如,二级结构预测是内部折叠、内部残基距离预测的基础。更进一步,二级结构预测可以作为其它工作的基础,例如,用于推测蛋白质的功能,预测蛋白质的结合位点等。


相关文章

超1800万,中南大学将采购高通量蛋白组质谱系统等设备

中南大学 2025年11月政府采购意向公开为便于供应商及时了解政府采购信息,根据《财政部关于开展政府采购意向公开工作的通知》(财库〔2020〕10号)等有关规定,现将中南大学2025年11月......

新研究:一种蛋白质可能是诊疗男性不育的关键

日本研究人员参与的一个国际团队近日在英国《自然-通讯》杂志发表论文说,一种蛋白质在实验鼠精子与卵子结合过程中发挥关键作用,由于人体内也有这种蛋白质,这项成果可能有助于诊疗男性不育。日本熊本大学和大阪大......

科研团队成功利用人工智能蛋白语言模型揭示生命演化奥秘

为什么不同生物在适应相似环境时,会独立演化出相似的功能?一项最新研究从蛋白质的“高阶特征”层面揭示了这一生命演化奥秘的重要机制。这项研究由中国科学院动物研究所邹征廷研究员团队完成,成功利用人工智能领域......

科学家发现一种能够逆转大脑衰老的蛋白质

衰老对海马体(大脑中负责学习和记忆的区域)的影响尤为严重。如今,旧金山加州大学的研究人员发现了一种在该衰退过程中起核心作用的蛋白质。这项研究成果于8月19日发表在《自然—衰老》期刊上。科学家们确认FT......

2025年全国糖生物学会议启幕甜蜜之约,共探前沿

2025年8月9日,备受瞩目的2025年全国糖生物学会议暨第六届全国糖化学会议在四川成都正式开幕。本届盛会由中国生物化学与分子生物学会糖复合物专业分会、中国化学会糖化学专业委员会、安特百科(北京)技术......

蛋白质生成卡顿引发细胞老化

德国莱布尼茨老龄研究所团队在一种名为鳉鱼的淡水鱼大脑中发现,随着年龄增长,细胞内合成蛋白质的“工厂”——核糖体,在制造某一类关键蛋白质时出现卡顿,从而引发一连串恶性循环,导致细胞功能不断衰退。这或许是......

两步突破难题!湖大岳磊团队HydroWash新策略实现DESIMSI蛋白质成像双重提升

近日,湖南大学生物学院生物与化学质谱实验室岳磊教授团队在蛋白质质谱成像(MSI)领域取得重要突破。团队创新性地提出了组织蛋白质成像新策略:HydroWash。该方法创新性地将组织洗涤与明胶水凝胶调控相......

重磅!因美纳将收购SomaLogic,3.5亿美元现金!

将高度互补的蛋白质组学技术专长与因美纳行业领先的产品创新和全球市场影响力相结合为因美纳在广阔且持续增长的市场中实现增长奠定基础自2021年末以来,因美纳与SomaLogic即在蛋白质组学联合开发方面开......

阿里云生物基础大模型登上Nature子刊可挖掘核酸、蛋白质之间的内在联系

6月19日消息,国际顶级期刊《NatureMachineIntelligence》发表了阿里云AIforScience的研究成果LucaOne。这是业界首个联合DNA、RNA、蛋白质的生物大模型。该大......

植物减数分裂过程中染色体精准分离调控获揭示

近日,华南农业大学教授王应祥团队在国家自然科学基金等项目的资助下,研究揭示了模式植物拟南芥泛素连接酶后期促进复合物/细胞周期体(APC/C)调控减数分裂染色体正确分离的分子机制。该研究丰富了蛋白质泛素......