发布时间:2014-05-30 09:03 原文链接: Nature:科学家发布人类蛋白质组草图里程碑成果

两个独立研究小组绘制了人体组织和细胞系质谱分析图谱,公布了近乎完整的人类蛋白质组草图。

  日前,两个国际小组均在《自然》杂志上公布了人类蛋白质组第一张草图,这些在大部分非患病人体组织和器官中表达的精选蛋白,为更好的理解疾病状态下发生的机体变化,奠定了坚实的基础。这两项最新研究揭示了人类基因组的更多复杂性,并从之前认为属于非编码区域的基因组中发现了新蛋白。

  波士顿儿童医院蛋白质组学主任Hanno Steen(未参与这项研究)表示:“虽然之前其它一些大型蛋白质组数据集也收集了接近上万个蛋白数据,但是这两项成果确实是真正的突破性成果,全面覆盖了超过80%的人类预期蛋白质组,其中还有一些之前未曾被发现的蛋白。这些成果清楚地表明,想要达到这样的蛋白覆盖率深度,就需要探索许多不同的组织类型。”

  在第一篇文章中,来自约翰霍普金斯大学的蛋白质组研究员Akhilesh Pandey,与来自印度生物信息学研究所等处的研究人员合作,分析了30种不同的组织类型,编撰了由84%所有预期编码蛋白的人体基因翻译得到的蛋白。

  这项研究识别出17, 294个蛋白编码基因,并通过表达分析证明了组织和细胞特异性蛋白的存在,并且研究人员还通过从注解的假基因、非编码RNA和未翻译的区域识别翻译的蛋白,表明了“蛋白基因组”分析的重要性。

  研究人员在线公布了这些人类蛋白质组图谱发现,相关数据将很快可以通过美国生物技术信息数据中心(the National Center for Biotechnology Information database)查询得到,Pandey说。

  同时另外一篇文章中,来自德国研究人员慕尼黑工业大学的Bernhard Küster等人创新性的推出了一个搜索性公共数据库:ProteomicsDB,这一数据库公布了18, 097个基因获得的蛋白,占目前预计人类蛋白总数(19, 629)的92%。这种数据能用于识别数百个翻译的lincRNAs,对药物敏感的标记,以及用于发现mRNA和组织中的蛋白水平之间的定量关系等。

  这两个研究组都利用了质谱方法分析人类组织,Pandey研究组分析的是全新的数据,针对了多种不同健康人体组织的数据,其中包括七种胎儿组织和六种血细胞类型。

  而Küster研究组则采用了稍微有些不同的方法,他们汇集了已有质谱分析数据,以及同事的一些成功,这些大约占据ProteomicsDB数据的60%。为了填补这些数据间的空白区域,Küster实验室构建了自己的质谱数据,分析了60个人类组织体液,13个体液,以及147个的癌细胞系。Küster表示,他们只挑选了高分辨率的公共数据,这些数据具有严格的计算过程,高质量控制标准。

  “这两项研究可以互补”,加拿大多伦多Lunenfeld-Tanenbaum研究院的 Anne-Claude Gingras(未参与该项研究)评价道,“前者霍普金斯大学的研究真正发现了之前蛋白质组学的缺陷所在,从单一来源进行了人体蛋白质的研究,有助于通过他们的数据进行简单比对”,而后者ProteomeDB的研究,则将新内容与原有蛋白质组数据联系在了一起,正如Küster所说,就是发展和完善原有数据库,进一步从蛋白研究中汇集更多资源。

  此外Küster实验室通过比较每个蛋白与mRNA水平的比例,发现翻译比例对于每种mRNA转录来说是一个恒定特征。“这是一个令人惊讶的发现,具有重要意义”Gingras说。

  Steen表示赞同,“如果这个观点正确的话,那么将会给原有的法则提出新的内容。之前研究人员发现转录组合蛋白质组数据好似一个硬币的两面,”他说,“但这一分析又进一步表明,至少在稳定状态下,一旦一对mRNA/蛋白比例被计算出来,那么蛋白水平就能从特定的mRNA水平中估算出来。”

  这两项研究提出的证据表明之前被认为不能翻译的DNA区域其实能进行翻译,这其中包括Küster 研究组发现的400多个基因间非编码RNAs(lincRNAs),以及Pandey研究组发现的193个新蛋白。但是这些新发现的蛋白质的生物学意义还不清楚。

  “目前的基因组注释主要基于计算运算法则,”约翰霍普金斯大学研究员,人类蛋白质组图谱作者之一Min-Sik Kim说,“这些预测可能并不完全准确,这就是为什么需要直接分析蛋白的原因。”

  Pandey研究组目前正在分析进一步分析胎儿蛋白质组,以及将蛋白质翻译后修饰数据添加到数据库中。这一研究组还希望能深入探索人脑器官,这一部分是目前公布的蛋白质组图谱中不包含的部分。

  “我们一般认为,信息的传递是从基因组到转录组,再到蛋白质组。这些最新研究却表明,这其实是一个双向的途径——蛋白质组也可以用于注释基因组。其重要性在于利用这些数据集,我们能进一步注释基因组,改进预测转录和翻译的运算法则”,Steen说,“基因组学领域将从蛋白质组学数据中获益良多。”

相关文章

新进展!构建新型双碱基编辑器

碱基编辑器是基于CRISPR/Cas9发展的新一代基因组编辑技术,可诱导单个碱基的突变,而鲜有关于特异性介导A-to-G和C-to-G双突变的碱基编辑工具的研究。此外,关于碱基编辑系统与染色质环境之间......

蛋白质组学研究可投哪些期刊?

    蛋白质作为功能的直接行使者,已经被科研工作这广泛应用于不同领域中,目前蛋白组学有很多优秀的科研成果,在各个领域及期刊上发表,其中也不乏CNS在内的顶级期......

ASMS布鲁克总裁专访:timsTOFUltra开启蛋白质组学新篇章

【导读】以每6个月进行一代创新的速度,布鲁克自推出timsTOF以来,不断刷新多组学研究的记录,并毫无意外地在每年ASMS上,为广大的粉丝和用户们奉上新的力作。在今年第71届ASMS大会上,布鲁克宣布......

16岁女孩研究自杀者大脑中的秘密,获得了5万美元奖金

根据世卫组织的统计,平均每过40秒,地球上就有一个人因为自杀而失去生命。美国疾病控制与预防中心(CDC)的信息显示,到目前为止,人类的自杀风险通常是依靠抑郁症或其他精神疾病的病史、生活环境因素如童年时......

直接分辨单个氨基酸分子小小纳米孔破解蛋白质测序难题

蛋白质是生命活动的主要承担者。测量组成蛋白质的氨基酸的排列顺序被称为蛋白质测序。由于缺乏普适、高效的测序技术,人类对蛋白质的了解还极其有限,生命世界的诸多奥秘仍待破解。近日,浙江大学化学系冯建东团队提......

直接分辨单个氨基酸分子小小纳米孔破解蛋白质测序难题

蛋白质是生命活动的主要承担者。测量组成蛋白质的氨基酸的排列顺序被称为蛋白质测序。由于缺乏普适、高效的测序技术,人类对蛋白质的了解还极其有限,生命世界的诸多奥秘仍待破解。近日,浙江大学化学系冯建东团队提......

NAC在真核生物蛋白合成工厂中起着分子控制中心的作用

根据基因蓝图,一系列氨基酸在我们细胞的蛋白合成工厂---核糖体--中被组装成长的氨基酸链,即蛋白。每个新形成的蛋白都是从一个称为甲硫氨酸的氨基酸开始的。在蛋白合成过程中,当不断增长的氨基酸链通过“核糖......

“画蛇添足”并非无迹可寻,远古时期的蛇是有脚的

成语有云:画蛇添足,形容做事多此一举。但蛇真的无脚吗?爬行动物专家认为,蛇的祖先是蜥蜴,在远古时期,蛇是有脚的,只是在演化过程中慢慢失去了。近日,这一说法得到了进一步证实。经过5年的研究,基于大规模多......

蛋白质酰基化修饰与生物合成代谢研究再获新进展

近日,华东理工大学生物工程学院、生物反应器工程国家重点实验室叶邦策教授团队在蛋白质酰基化修饰与生物合成代谢研究领域再次取得重要进展,相关研究成果以“乙酰磷酸与c-di-GMP协同调节BldD活性,控制......

祝贺!中国科学家组团攻关,取得重大成果

日前,由复旦大学、西安交通大学等国内26个科研单位联合开展研究,绘制出了基于36个族群的中国人泛基因组参考图谱,相关成果于北京时间14日在国际权威学术期刊《自然》杂志发表。这也是我国科学家首次自主进行......