发布时间:2017-01-24 16:45 原文链接: Science:利用宏基因组数据预测之前未知的蛋白结构

  根据一项新的研究,从多种环境中收集的DNA序列数据有助研究人员构建出600多种蛋白家族的三维结构模型,而在此之前,它们的结构是未知的。这些宏基因组数据能够让人们在多种物种之间进行蛋白序列比较,从而允许利用统计学力量预测这些之前不可能预测的蛋白结构。相关研究结果发表在2017年1月20日那期Science期刊上,论文标题为“Protein structure determination using metagenome sequence data”。

  美国加州大学洛杉矶分校蛋白生化学家David Eisenberg(未参与这项研究)说,“重大的关键信息是如今利用计算方法获得非常好的蛋白结构模型是可行的。这是非常重要的,这是因为[这些作者们]能够获得比几年前获得的更多蛋白的结构模型。”

  重要的是,德国马克斯-普朗克生物物理化学研究所计算生物学家Johannes Söding(也未参与这项研究)补充道,“这些方法并不需要任何实验数据”,比如利用X射线晶体分析术或核磁共振成像等揭示蛋白结构的传统技术获得的那些数据。

  Söding解释道,直到最近,生物学家们利用同源建模预测他们喜欢的蛋白的结构---“那就是你有一种与你感兴趣的蛋白存在同源关系的模板蛋白,而且利用这种同源性,你基本上能够复制这种结构,并让它适应这种新的序列。”但是,他说,利用这种新的方法,“即便你没有模板蛋白的话,你也能够构建出[准确的]模型”。

  领导这项新研究和开发出蛋白结构预测软件Rosetta的美国华盛顿大学研究员David Baker说,自从发现氨基酸序列决定着蛋白折叠方式以来,科学家们一直在研究利用蛋白序列计算它的结构的方法。

  Baker说,已知蛋白折叠成它们最低的能量状态,但是经常存在如此多可能的低能量构象,特别是对大分子蛋白而言,毕竟构象本身很少会提供有价值的信息。他补充道,利用实验确定的蛋白结构数据能够提高Rosetta的计算准确性,“但是几年前,我们和其他人已意识到如果你拥有来自一个大的蛋白家族的足够多序列,那么你可能能够基于它们在进化期间的共同变异(covariation),鉴定出在三维结构中进行接触的氨基酸残基对。”

  简而言之,如果两个氨基酸在一个蛋白内相互作用,那么它们可能一起进化。比如,如果它们的电荷是相反的,一种突变改变一个氨基酸的电荷,那么另一个氨基酸可能也会发生改变。对来自多种物种的给定蛋白进行序列比较能够鉴定出这些共同进化的---因此相互作用的---氨基酸残基。

  几年前,Baker团队利用这种方法预测几十种蛋白家族的结构。自那以后,其中的6种蛋白已通过实验加以确定,而且在这项新的研究中,对Rosetta预测结果和这些实验结果进行一一比较,结果表明它们是“真地真地类似的”。

  但是如果感兴趣的蛋白并没有大量的多样性序列用于比较,那么将会怎么样?Baker解释道,这正是宏基因组学发挥作用的地方。

  Baker说,宏基因组数据是通过对一种给定样品(比如土壤,池塘水等等)中的所有DNA进行测序获得的,因此“你获得巨大的多样性序列。它极大地扩大蛋白家族的数量,因此有足够多的序列比较来产生准确的结构模型。”确实,利用宏基因组数据,Baker团队能够自信地预测另外614个蛋白家族的结构。

  Baker说,“它是非常令人关注的,这是因为每个蛋白家族当中有至少1000种不同的蛋白,因此这些结构模型很可能覆盖一百万多种当前结构未知的蛋白。”

  Baker说,相比于真核生物DNA序列,宏基因组数据通常含有更高比例的原核生物DNA序列。因此,在剩余的4500种左右的仍然没有结构模型的蛋白家族当中,很多蛋白家族是真核生物特异性的。他说,“如今,我们正在尝试着做的事情是收集来自全世界正在参加针对鸟、鱼、蠕虫和真菌等真核生物的基因组测序项目的人体中的基因组序列。”

  美国马里兰大学的John Moult(未参与这项研究)说,“这项研究的限制在于序列可获得性。但是,如今每年有大量的新序列出现,因此仅需提前预测一下,你就会明白这一点:利用这种相同的方法,你将会在接下来的5年或10年内对剩下的蛋白家族留下深刻的影响。”

相关文章

科研人员深度挖掘人类肠道宏基因组的古菌病毒

北京时间12月30日,中国科学院深圳先进技术研究院合成生物学研究所马迎飞团队在国际学术期刊《自然-通讯》(naturecommunications,IF=17.69)上发表了题为"Metag......

人类肠道宏基因组的古菌病毒研究新进展

2022年12月30日,中国科学院深圳先进技术研究院合成生物学研究所马迎飞团队在《自然-通讯》(NatureCommunications)上,发表了题为Metagenomicanalysisrevea......

单细胞拉曼结合靶向宏基因组揭示土壤活性抗生素耐药组

抗生素耐药性(AMR)在人类、环境和动植物间的传播,加剧全球“OneHealth”的负担。土壤是“OneHealth”的关键环节之一,所携带的抗生素耐药性可通过食物链等方式转移至人类而带来健康威胁。土......

第三条路线,我学者实现环境宏基因组功能基因发掘突破

从环境宏基因组中挖掘功能基因通常有两条技术路线,一条是建立克隆文库后直接用筛选压力筛选阳性克隆,一条是通过设计引物,从宏基因组中克隆目标基因,然后进行功能研究。近日,李小方研究员团队发展了第三条技术路......

无需PCR,这项技术半小时就能获得新冠病毒基因序列

当前,针对新型冠状病毒的主要检测技术有免疫、PCR和高通量测序(NGS)三类,其中免疫和PCR方法是一种定向检测,可以对病毒进行筛查,适合对患者标本中是否存在病毒进行诊断。图片来源于网络高通量测序作为......

宏基因组测序帮助科学家增加12倍海洋病毒种类

你知道吗?当你在海里游泳时吞下一口海水,就可能吞下了数以亿计的病毒。尽管海洋中的病毒数量惊人,并且在自然界的碳循环等过程中发挥着关键作用,但自海洋病毒首次被发现以来的几十年里,科学家仍然对其多样性及遗......

Cell重磅发布15万人体微生物基因组!揭示微生物新物种

微生物宏基因组是当今世界最热门的科研领域之一。越来越多的研究表明,人体微生物发挥着重要的健康作用,但大部分多样性仍未得到充分探索,尤其是在除肠道以外的身体部位及非西方人群。在今日发表在Cell期刊的一......

Science:利用宏基因组数据预测之前未知的蛋白结构

根据一项新的研究,从多种环境中收集的DNA序列数据有助研究人员构建出600多种蛋白家族的三维结构模型,而在此之前,它们的结构是未知的。这些宏基因组数据能够让人们在多种物种之间进行蛋白序列比较,从而允许......

中国学者Nature发表突破性宏基因组研究改写病毒学教科书

中国疾病控制中心与悉尼大学合作十一月二十四日在Nature杂志上发表了一项突破性的宏基因组研究。研究人员深入无脊椎动物的病毒世界,从中发现了1445种病毒,包括不少新病毒家族。文章通讯作者是中国疾病控......

宏基因组测序揭示神秘的生命领域

美国国家能源部LawrenceBerkeley实验室和加州大学伯克利分校的研究人员采用科罗拉多蓄水层的沉积物和地下水样本,通过宏基因组测序重建了二千五百多个微生物的基因组。这项研究发表在十月二十四日的......