发布时间:2015-06-18 13:42 原文链接: 解决基因组学重要挑战的新工具

  单细胞基因组学和宏基因组学是开创性的技术,可帮助研究人员评估环境微生物群落的结构和功能。现在应用这些技术的项目越来越多,但是,仍缺乏一种高通量过程来检查所组装的基因组序列,从而阻碍了这些技术的广泛应用。目前,去除已上传到公共数据库的微生物基因组中的污染序列,还是一个手动和耗时的过程,为了去除污染序列,就需要有关它们的信息。

  为了解决这个障碍,来自美国能源部联合基因组研究所(DOE JGI)原核生物超级项目(Prokaryotic Super Program)的一个研究团队,首次开发了一种计算机程序,可快速、自动地去除基因组草图中的污染序列。他们开发的这种工具称为ProDeGe (Protocol for Decontamination of Genomes),发表在六月九日的Nature旗下子刊《The ISME Journal》。延伸阅读:Nature Biotechnology报道最新基因组组装方法。

  该研究小组表示,ProDeGe适用于任何类型的基因组序列,在这项研究中,研究人员使用182个手动筛选的单一扩增基因组(SAGs)对其进行了校准,基因组序列来自两个公开的数据集——一个是Microbial Dark Matter project,另外一个是拟南芥植物数据。

  快速去除序列污染

  该小组报道称,这种工具将基因组序列分类为“干净的”或“污染的”,并以每百万碱基序列0.30 CPU核小时的速度运行。本文第一作者Kristin Tennessen指出:“一名专家手动净化1巨碱基序列,需要约六小时的时间。而使用ProDeGe则提速了约20倍。她补充说,如果手动用户是没有经验的,去除污染序列的速度提高的更快。

  用于质量控制的污染序列去除工具

  英属哥伦比亚大学DOE JGI 长期合作者、ProDeGe用户Steven Hallam说:“每年都产生大量的环境序列信息,单细胞基因组测序也越来越普及。因此,ProDeGe将填补QA/QC工作流程在个人用户和平台服务之间的一个关键差距。”

  研究人员补充说,ProDeGe向“为培养微生物和未培养微生物基因组,建立一套质量控制标准”迈出了第一步。防止污染序列数据传播到公共数据库,是很有价值的,从而能避免产生误导性的分析。该程序的全自动化,可减轻科学家的人工筛选时间,产生可靠、干净的数据集,并首次使我们能够高通量地筛选数据集。因此,在新一代DNA测序和独立培养微生物基因组学的时代,ProDeGe代表了我们工具箱中的一个关键部件。

  作为ProDeGe工具的使用者,Bigelow 实验室单细胞基因组中心主任Ramunas Stepanaukas和DOE JGI的合作者补充说,单细胞基因组学和宏基因组学已经成为未培养微生物生物学信息的主要来源,这是我们这个星球上大多数生态系统的主要成分。DNA污染风险,是单细胞基因组测序和基因组组装的一个重要挑战。预防、检测和去除单细胞基因组学和宏基因组学数据中的污染序列,对于了解我们星球的生态系统,是至关重要的。新的实验室和计算工具,如ProDeGe,是确保这些新兴研究领域中数据质量高标准的关键。

  ProDeGe上传和分析数据集的Web界面,可以访问http://prodege.jgi-psf.org。Prodege独立软件可以从http://prodege.jgi-psf.org/downloads/src下载,可在Perl、R和NCBI Blast系统上运行。

相关文章

又一POCT企业今日敲钟上市!市值超45亿!董事长为85后!

公司此前15年不温不火,直到新冠疫情的快速蔓延,英诺特异军突起,营收倍增,成为新冠检测试剂的王牌之一。今日,以胶体金快速诊断平台为主业的IVD企业——北京英诺特正式敲钟上市。股票简称为英诺特,股票代码......

长期被人们忽视的DNA重组对于了解人体疾病至关重要

科技日报北京7月26日电(记者张梦然)日本理化学研究所综合医学科学中心科学家主导的国际合作研究发现,在人类每个细胞的基因组中,重复数百万次的特定基因组序列重组普遍存在于正常细胞和疾病状态的细胞中。确定......

“全球生物图片搜索系统”亮相数字中国建设峰会

7月23日,中国科学院西双版纳热带植物园开发的“全球生物图片搜索系统”亮相第五届数字中国建设峰会,这是云南省入选本次峰会数字中国建设成就巡礼专题展的2个数字成果之一。全球生物图片搜索系统展位 ......

《Cell》:世界首张小鼠微型“扰动图谱”,解密基因功能

7月22日,上海科技大学生命学院池天课题组在《细胞》(Cell)杂志在线发表论文,报道了一种崭新的小鼠基因打靶技术iMAP(inducibleMosaicAnimalforPerturbation),......

土壤添加生物质炭影响白蚁微生境偏好性获揭示

广东省科学院动物研究所研究团队研究揭示土壤添加生物质炭影响台湾乳白蚁微生境偏好性。相关研究发表于EcotoxicologyandEnvironmentalSafety。广东省科学院动物研究所陈勇博士为......

生物医学研究的重要里程碑——世界首张小鼠“扰动图谱”

“人类基因组早被测序,但其功能至今深藏不露,这严重妨碍了疾病诊治。”上海科技大学生命学院教授池天说,“21世纪生物医学的重要任务就是解码人类基因组这部‘神秘天书’。”7月22日,池天团队在《细胞》在线......

科学家从基因组水平揭示了金荞麦和苦荞的差异性

中国农业科学院作物科学研究所特色农作物优异种质资源发掘与创新利用团队从基因组水平揭示了金荞麦和苦荞性状差异的重要原因,对金荞麦的生态类型进行了初步的划分和比较,并开发了与芦丁代谢相关的分子标记,为金荞......

Nature:只需要几滴血,研究人员就可以找到治疗癌症方法

今天发表在《Nature》杂志上的一项研究概述了这项技术。这项史无前例的血液测试分析了转移性癌症进入血液的DNA,即循环肿瘤DNA(ctDNA)。通过对ctDNA的整个基因组进行测序,该测试揭示了每个......

深度学习实现蛋白质序列高成功率从头设计

中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS......

我国科学家发现黄花蒿首个染色体级别基因组图谱

疟疾至今仍威胁着人类的健康。黄花蒿是全球普遍使用的抗疟疾药物——青蒿素的主要天然资源,保障全球优质廉价的青蒿素原料供应对于全球疟疾防控有重要价值。但黄花蒿基因组杂合度和重复度很高,致使高质量的黄花蒿基......