发布时间:2015-02-03 10:12 原文链接: 新技术90分钟完成全基因组序列分析

  美国国家儿童医院(Nationwide Children's Hospital)的研发人员最近在Genome Biology上发布了一个自主开发的分析软件,表示这个软件使寻找全基因组致病变异从几周缩短到按几十个小时。

  第一个人类基因组测序完成耗时大约13年,耗费30亿美元,而现在技术测序技术的发展,使得即使是很小的研究小组都可以在几天之内完成基因组测序。但是从测序产生的巨大的数据分析得出真正能用于研究或者临床的信息一直是一个挑战。而彼得·怀特博士和他带领的团队针对这个问题,利用新颖的计算技术,开发了一个名为"丘吉尔"(Churchill)的计算管道,表示"丘吉尔"可以在短短90分钟内完成全基因组样品的有效分析。

  "丘吉尔"自动输入原始序列资料,通过一系列密集复杂和计算,最终分析出有临床或者科研意义的的遗传变异体。这个过程中的每一步,"丘吉尔"都有优化,以显著减少分析时间,但不损害数据的完整性,该分析是100%的可重复性。"丘吉尔"采用的平行化(parallelization)的算法克服了染色体带来的平行化限制,极大提升了数据输入的平衡性和分析中数据重新组合,去分,再校准和基因型分型的执行性。通过检查在数据分析过程中的计算资源的利用,相比其他两种分析管道-HugeSeq和GATK-Queue只能分别利用46%和30%的数据资源,"丘吉尔"的利用率达到了92%,并在多个服务器非常有效地进行缩放。"丘吉尔"输出结果,在与其他计算管道比较,被证明具有最高99.7%的灵敏度;最高99.99%的精读和99.66%最高整体诊断效率。

  这种效率和能力,证明"丘吉尔"或能够进行人口规模的基因组分析。为了证明"丘吉尔"的能力,怀特博士和他的团队成功地分析了千人基因组项目所产生的第一阶段的原始数据(千人基因组项目是以生成世界各地的多个群体人类遗传变异的公众目录为目的的国际合作项目)。利用亚马逊网络服务(AWS)的云计算资源,"丘吉尔"仅用七天便完成1088个全基因组样本的分析,并确定了数以百万计的新的遗传变异。

  "丘吉尔"的发布是测序技术一个极大的进步。它极大降低测序分析的成本,突破了当今测序分析计算的瓶颈,特别为现在大人口规模的基因组学的研究提供便利。

相关文章

《自然》发表人类遗传变异体大型数据库gnomAD

英国《自然》杂志及其子刊27日在线发表了基因组聚集数据库(gnomAD)团队的系列研究论文,介绍了研究人员对这个大型数据库的多方面分析,其结果有助人们深入认识人类基因功能,提升对罕见和常见遗传病的理解......

medRxiv:基因组变异或会促进SARSCoV2的传播扩散速度

日前,一篇刊登在预印版平台medRxiv上的研究报告中,来自加利福尼亚大学等机构的科学家们通过研究发现,随着新冠病毒SARS-CoV-2在全球传播扩散,其传播速度或会随着基因组的变化而变化,对病毒基因......

改进的CRISPRCas9,可靶向整个基因组中的任何位点

许多基础研究人员和临床研究人员正在测试利用一种简单有效的基因编辑方法来研究和校正导致从失明到癌症等各种疾病的致病突变的潜力,但是这种技术受到一定限制,即必须在基因编辑位点附近存在某个较短的DNA序列。......

一文读懂类胡萝卜素的合成——参考胡萝卜基因组

一、类胡萝卜素(carotenoids):1.是有一系列共轭双键和甲基支链基本结构的一类高度不饱和化合物的总称,四萜化合物。典型的类胡萝卜素是由8个异戊二烯单位首尾相连形成。类胡萝卜素的颜色因共轭双键......

研究揭示海湾扇贝两个亚种基因组测序和组装

日前,青岛农业大学在扇贝育种研究方面再次取得重要进展,海洋科学与工程学院教授王春德课题组与合作单位成功完成海湾扇贝北部亚种和南部亚种基因组测序和分析,相关研究成果在线发表于《自然》旗下开源期刊Scie......

科研人员建立植物基因组引导编辑技术体系

基因组编辑技术可以定向修饰植物基因组,从而大大加速植物育种的进程,是实现作物精准育种的重要技术突破。然而,作物的许多重要农艺性状是由基因组中的单个或少数核苷酸的改变或突变造成的。基于CRISPR/Ca......

中美科学家联合研究构建植物CRISPRCas12b基因组编辑系统

2020年03月09日,美国马里兰大学YipingQi博士及电子科技大学张勇教授课题组合作于《NaturePlants》发表了题名《CRISPR-Cas12benablesefficientplant......

研究团队合作发布白木香基因组精细图谱

近日,中国热带农业科学院热带生物技术研究所和中国农业科学院深圳农业基因组研究所崔鹏团队合作发布了白木香基因组精细图谱,相关研究结果已发表在GigaScience期刊。该基因组精细图谱的发布将为野生白木......

2019ncov的基因组为?

冠状病毒主要引起呼吸道和胃肠道感染,并且在遗传学上被分为四个主要的病毒属:甲型冠状病毒(Alphacoronavirus)、乙型冠状病毒(Betacoronavirus)、丙型冠状病毒(Gammaco......

新冠病毒的颠覆性发现!华南海鲜市场并非病毒发源地

据中国科学院西双版纳热带植物园官方网站消息,该园联合华南农业大学和北京脑科中心,收集了全球共享到GISAIDEpiFluTM数据库中覆盖四大洲12个国家的93个新冠病毒样本基因组数据(截至2月12日)......