发布时间:2015-06-17 14:37 原文链接: 解决基因组学重要挑战的新工具

  单细胞基因组学和宏基因组学是开创性的技术,可帮助研究人员评估环境微生物群落的结构和功能。现在应用这些技术的项目越来越多,但是,仍缺乏一种高通量过程来检查所组装的基因组序列,从而阻碍了这些技术的广泛应用。目前,去除已上传到公共数据库的微生物基因组中的污染序列,还是一个手动和耗时的过程,为了去除污染序列,就需要有关它们的信息。

  为了解决这个障碍,来自美国能源部联合基因组研究所(DOE JGI)原核生物超级项目(Prokaryotic Super Program)的一个研究团队,首次开发了一种计算机程序,可快速、自动地去除基因组草图中的污染序列。他们开发的这种工具称为ProDeGe (Protocol for Decontamination of Genomes),发表在六月九日的Nature旗下子刊《The ISME Journal》。

  该研究小组表示,ProDeGe适用于任何类型的基因组序列,在这项研究中,研究人员使用182个手动筛选的单一扩增基因组(SAGs)对其进行了校准,基因组序列来自两个公开的数据集——一个是Microbial Dark Matter project,另外一个是拟南芥植物数据。

  快速去除序列污染

  该小组报道称,这种工具将基因组序列分类为“干净的”或“污染的”,并以每百万碱基序列0.30 CPU核小时的速度运行。本文第一作者Kristin Tennessen指出:“一名专家手动净化1巨碱基序列,需要约六小时的时间。而使用ProDeGe则提速了约20倍。她补充说,如果手动用户是没有经验的,去除污染序列的速度提高的更快。

  用于质量控制的污染序列去除工具

  英属哥伦比亚大学DOE JGI 长期合作者、ProDeGe用户Steven Hallam说:“每年都产生大量的环境序列信息,单细胞基因组测序也越来越普及。因此,ProDeGe将填补QA/QC工作流程在个人用户和平台服务之间的一个关键差距。”

  研究人员补充说,ProDeGe向“为培养微生物和未培养微生物基因组,建立一套质量控制标准”迈出了第一步。防止污染序列数据传播到公共数据库,是很有价值的,从而能避免产生误导性的分析。该程序的全自动化,可减轻科学家的人工筛选时间,产生可靠、干净的数据集,并首次使我们能够高通量地筛选数据集。因此,在新一代DNA测序和独立培养微生物基因组学的时代,ProDeGe代表了我们工具箱中的一个关键部件。

  作为ProDeGe工具的使用者,Bigelow 实验室单细胞基因组中心主任Ramunas Stepanaukas和DOE JGI的合作者补充说,单细胞基因组学和宏基因组学已经成为未培养微生物生物学信息的主要来源,这是我们这个星球上大多数生态系统的主要成分。DNA污染风险,是单细胞基因组测序和基因组组装的一个重要挑战。预防、检测和去除单细胞基因组学和宏基因组学数据中的污染序列,对于了解我们星球的生态系统,是至关重要的。新的实验室和计算工具,如ProDeGe,是确保这些新兴研究领域中数据质量高标准的关键。

  ProDeGe上传和分析数据集的Web界面,可以访问http://prodege.jgi-psf.org。Prodege独立软件可以从http://prodege.jgi-psf.org/downloads/src下载,可在Perl、R和NCBI Blast系统上运行。

相关文章

AI揭示影响人脑发育基因组突变

科技日报北京2月21日电美国研究人员使用人工智能(AI)模型揭示了可能影响人类认知进化的基因组突变。这项人类基因组学的开创性研究可能会促进发现复杂脑部疾病的新疗法。该研究发表在新一期的《科学进展》上。......

染色体水平冬瓜参考基因组发布

近日,广东省农业科学院蔬菜研究所发布了染色体水平冬瓜参考基因组。相关研究发表于ScientificData,广东省农业科学院蔬菜研究所副研究员罗文龙和副研究员闫晋强为该论文共同第一作者,广东省农业科学......

首个家鸡基因组图谱绘制完成

西南大学教授徐洛浩课题组以中国特有家鸡品系胡须鸡为材料,在国际上率先绘制出首个家鸡全基因组图谱。2月13日,相关研究成果以《家鸡基因组完成图的演化分析》为题,发表在美国《国家科学院院刊》上。这是继去年......

千种热带植物基因组计划启动

近日,第一届国际热带植物学术会议在海南三亚举行。会上启动的海南大学—贝纳基因等千种热带植物基因组计划与热带作物基因组与分子育种数据库联合平台计划,将进一步加强热带海量植物资源保护与利用基础研究,服务海......

昆明动物所阐明多能干细胞基因组稳态维持新机理

多能干细胞(Pluripotentstemcells,PSCs)因在体外具无限增殖和分化为不同类型细胞的潜能,在再生医学领域中颇具应用前景,也成为目前临床上最具潜能的成药细胞。PSCs制备过程中的标准......

系列研究阐明多能干细胞基因组稳态维持新机理

多能干细胞(Pluripotentstemcells,PSCs)因其在体外具有无限增殖和分化为不同类型细胞的潜能,在再生医学领域中具有广泛应用前景,也成为目前临床上最具潜能的成药细胞。PSCs制备过程......

萝卜基因组组装与抽薹性状遗传调控机理解析研究新进展

近日,南京农业大学作物遗传与种质创新利用全国重点实验室、园艺学院萝卜遗传育种团队在植物学领域权威期刊PlantBiotechnologyJournal在线发表了题为“Achromosome-level......

研究揭示对环境高度敏感的鼠兔类群的进化响应

在当今保护生物学领域,如何保育栖息地片段化不断加剧的濒危物种和地理小种群受到了学者的高度关注。人为辅助为地理隔离的种群提供与同种异域种群甚至是姐妹种杂交的机会,能够促进基因流动,即遗传拯救(genet......

NationalScienceReview:揭示同域物种形成的成种模式

物种形成是演化生物学研究的核心问题之一。同域物种形成(sympatricspeciation)是指新物种从同一地域祖先物种中演化而来,在没有地理隔离的情况下产生了生殖隔离的过程。然而,在同域物种形成的......

遗传发育所在黍子的基因组研究中取得进展

多倍化在植物进化过程中反复发生,呈现出多倍体化-二倍体化的循环模式,所有被子植物至少经历了一次多倍化事件。多倍体形成之后,通常会迅速进入二倍体化的过程,最终演变成二倍体。多倍化后的基因组休克和二倍化可......