发布时间:2012-07-02 00:00 原文链接: Nature子刊:新技术攻克单分子测序大问题

  来自冷泉港实验室(CSHL)的一位定量生物学家及同事们开发出了一种混合错误校正新方法攻克了单分子测序的重大问题,可将长读(long reads)的准确度提高到99.9%。这一研究成果发布在7月1日的《自然生物技术》(Nature Biotechnology)杂志上。

  领导这一研究的是冷泉港实验室助理教授Michael Schatz以及马里兰大学国家生物防卫分析和反制中心的Adam Phillippy 和 Sergey Koren。

  在这篇文章中,研究小组开发了一个软件包可校正单分子测序新技术中的一个严重的问题:它生成的每五个或六个DNA“碱基”就有一个错误。高错误率是这一新技术主要优点的另一面:它生成了更长的基因组reads,相比于当前使用的其他技术要长100倍,因此可以提供相比当前第二代技术获得的更为完整的基因组结构图谱。

  利用数学算法,Schatz及研究团队保留了第三代技术的巨大优势,消除了它的主要缺点。他们将错误率从大约15%或以上减少到不到千分之一。这一数学计算以开放源代码发布到万维网上,大大提高了第三代测序在整个生物医学研究界的实用价值。

  研究小组通过将他们的算法应用到从在难度规模一端的微小噬菌体病毒到另一端的巨大的更为复杂的鹦鹉基因组的测序任务中,证实了单分子测序潜在应用的宽度。鹦鹉基因组的大小超过人类基因组的三分之一。“鹦鹉基因组远远优于从前测序的所有鸟类基因组,”Schatz说。

  了解它更好的原因是为了正确评估第三代测序的优势。主要的优势与每个read(例如测序仪生成的基因组片段read)的平均长度有关。个体序列被组装成contigs(重叠群),以拼图的方式组装片段。在当前使用的第二代技术中,contigs非常小,且有大量冗余。每个片段的“共有序列”( consensus),代表了许多分层reads的结果,往往非常准确。而小拼图片段(puzzle pieces)则阻碍了某些基因部分,如包含长重复序列部分的准确装配。

  兼备两代的优势

  用单分子测序,组装的contigs更长,提供了对相对较大基因组片段,包括那些包含冗长重复的片段的更好的图谱。这是Schatz和研究团队希望保留的,同时他们提高了无错误率。通过有效地利用了第二代和第三代技术的最佳方面做到了这一点。

  “我们称我们的做法为‘混合错误校正’(hybrid error correction),”Schatz解释说。

  研究小组的主要观点是利用他们实验中所利用的第三代测序仪Pacific Biosciences RS sequencer提供的长读数据,混合到另一台第二代测序仪获得的高度精确短读中。通过一种称为Celera Assembler的开放源基因组组装程序运行两种数据类型生成的最终的序列装配证实为99.9%的无错率,其中contigs的中位数大小是第二代“短读”测序仪的两倍。在随后重复的混合方法中Contig大小被预计随单分子长读测序改善略微增多。

  高质量的基因组组装对于基因组注释和比较基因组分析尤为重要。许多微生物基因组分析取决于完成的基因组,但利用旧技术它们的成本高昂。高质量分析更高等生物的基因组依赖连续序列捕获拼读基因的长DNA片段。近年来发现基因组中自发性发生的结构改变,即拷贝数变异表明了能够获得疾病受累个体干净准确的全基因组图谱的重要性。

  利用混合错误校正,Schatz和他的同事们证实与长度相关的高错误率不会是基因组组装的障碍。高错误的长读可有效组装与互补的短读结合生成从前不可能获得的组装。

相关文章

基于量子干涉的单分子晶体管面世

英国和加拿大科学家组成的一个国际研究团队开发出一种新型单分子晶体管,利用量子干涉来控制电子流。这一成果为在电子设备中使用量子效应带来了新的可能性,有望催生比现有设备更小、更快、更节能的新型晶体管,以制......

“女娲”基因组计划发布第五项成果

近日,“女娲”基因组团队重点阐释了适应性选择下非编码调控元件对表型演化的影响,相关研究发表于《分子生物学与进化》。这项工作是中国科学院生物物理研究所徐涛院士、何顺民研究员牵头的“女娲”(NyuWa)中......

PacBio2023年收入超2亿美元增长56%,净亏损3亿

    近日,PacBio(纳斯达克股票代码:PACB)公布截至2023年12月31日的季度和财年的财务业绩。2023年收入为2.005亿美元,与去年同期的1.......

一生中患病的几率或可预测,十种慢性病遗传风险估算更接近临床

通过分析基因组中数百万个微小的遗传差异,就可预测一个人一生中患某种疾病的几率。在过去的10年中,研究人员为数十种疾病制定了风险评分,希望有一天患者能利用这些信息来降低患病风险。在《自然·医学》杂志最新......

揭秘基因组“暗物质”

记国家自然科学基金重大研究计划“基因信息传递过程中非编码RNA的调控作用机制”在人类遗传信息传递过程中,非编码RNA不参与编码蛋白质,占全部RNA的98%,如同宇宙中神秘的“暗物质”,是生命活动调控的......

构建水稻基因组倒位变异图谱

近日,中国农业科学院深圳农业基因组研究所联合国内多家单位发布了迄今为止最大的水稻群体水平倒位变异图谱,并挖掘获得了新的水稻耐热优异等位基因,该研究对水稻育种改良具有重要意义。相关研究成果发表在《科学通......

基因组精确注释新方法:增强子鉴定新技术

近日,中国农业科学院深圳农业基因组研究所动物功能基因组学创新团队研发出增强子鉴定新技术。该技术与传统技术相比,平均分辨率提高了约10倍,为基因组的精确注释提供了新方法。相关研究成果发表在《核酸研究》(......

第三代半导体龙头共话“换道超车”

以碳化硅、氮化镓为代表的宽禁带半导体材料,被称为“未来电子产业基石”。近日,上交所科创板新质生产力行业沙龙第二期聚焦第三代半导体产业领域,汇聚华润微、芯联集成、天岳先进等3家半导体头部企业,及多家证券......

迈向CRISPR2.0,下一代基因编辑技术方兴未艾

美国食品药品监督管理局(FDA)本月稍早时间宣布,批准CRISPR/Cas9基因编辑疗法Casgevy上市,用于治疗12岁及以上镰状细胞贫血病患者。这是FDA批准的首款CRISPR基因编辑疗法。而11......

瑞孚迪:改变千万新生命——全基因组测序在新生儿筛查中的应用

导读:这项技术可以及早发现那些可能对患儿生命产生重大影响的罕见疾病。     瑞孚迪的这项首创研究证明了全基因组测序在对看似健康的新生儿的筛查中存在重......