发布时间:2012-07-02 00:00 原文链接: Nature子刊:新技术攻克单分子测序大问题

  来自冷泉港实验室(CSHL)的一位定量生物学家及同事们开发出了一种混合错误校正新方法攻克了单分子测序的重大问题,可将长读(long reads)的准确度提高到99.9%。这一研究成果发布在7月1日的《自然生物技术》(Nature Biotechnology)杂志上。

  领导这一研究的是冷泉港实验室助理教授Michael Schatz以及马里兰大学国家生物防卫分析和反制中心的Adam Phillippy 和 Sergey Koren。

  在这篇文章中,研究小组开发了一个软件包可校正单分子测序新技术中的一个严重的问题:它生成的每五个或六个DNA“碱基”就有一个错误。高错误率是这一新技术主要优点的另一面:它生成了更长的基因组reads,相比于当前使用的其他技术要长100倍,因此可以提供相比当前第二代技术获得的更为完整的基因组结构图谱。

  利用数学算法,Schatz及研究团队保留了第三代技术的巨大优势,消除了它的主要缺点。他们将错误率从大约15%或以上减少到不到千分之一。这一数学计算以开放源代码发布到万维网上,大大提高了第三代测序在整个生物医学研究界的实用价值。

  研究小组通过将他们的算法应用到从在难度规模一端的微小噬菌体病毒到另一端的巨大的更为复杂的鹦鹉基因组的测序任务中,证实了单分子测序潜在应用的宽度。鹦鹉基因组的大小超过人类基因组的三分之一。“鹦鹉基因组远远优于从前测序的所有鸟类基因组,”Schatz说。

  了解它更好的原因是为了正确评估第三代测序的优势。主要的优势与每个read(例如测序仪生成的基因组片段read)的平均长度有关。个体序列被组装成contigs(重叠群),以拼图的方式组装片段。在当前使用的第二代技术中,contigs非常小,且有大量冗余。每个片段的“共有序列”( consensus),代表了许多分层reads的结果,往往非常准确。而小拼图片段(puzzle pieces)则阻碍了某些基因部分,如包含长重复序列部分的准确装配。

  兼备两代的优势

  用单分子测序,组装的contigs更长,提供了对相对较大基因组片段,包括那些包含冗长重复的片段的更好的图谱。这是Schatz和研究团队希望保留的,同时他们提高了无错误率。通过有效地利用了第二代和第三代技术的最佳方面做到了这一点。

  “我们称我们的做法为‘混合错误校正’(hybrid error correction),”Schatz解释说。

  研究小组的主要观点是利用他们实验中所利用的第三代测序仪Pacific Biosciences RS sequencer提供的长读数据,混合到另一台第二代测序仪获得的高度精确短读中。通过一种称为Celera Assembler的开放源基因组组装程序运行两种数据类型生成的最终的序列装配证实为99.9%的无错率,其中contigs的中位数大小是第二代“短读”测序仪的两倍。在随后重复的混合方法中Contig大小被预计随单分子长读测序改善略微增多。

  高质量的基因组组装对于基因组注释和比较基因组分析尤为重要。许多微生物基因组分析取决于完成的基因组,但利用旧技术它们的成本高昂。高质量分析更高等生物的基因组依赖连续序列捕获拼读基因的长DNA片段。近年来发现基因组中自发性发生的结构改变,即拷贝数变异表明了能够获得疾病受累个体干净准确的全基因组图谱的重要性。

  利用混合错误校正,Schatz和他的同事们证实与长度相关的高错误率不会是基因组组装的障碍。高错误的长读可有效组装与互补的短读结合生成从前不可能获得的组装。

相关文章

736万!河南省疾病预防控制中心2025年9至10月政府采购意向

为便于供应商及时了解政府采购信息,根据《河南省财政厅关于开展政府采购意向公开工作的通知》(豫财购〔2020〕8号)等有关规定,现将河南省疾病预防控制中心2025年9(至)10月采购意向公开如下:序号采......

3270万元,一单位采购测序仪、显微镜、单细胞质谱等设备

zycgr210713012025年8至12月政府采购意向为便于供应商及时了解政府采购信息,根据《财政部关于开展政府采购意向公开工作的通知》(财库〔2020〕10号)等有关规定,现将zycgr2107......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

890万,岛津、赛默飞等中标海珠疾控2025年第一批医疗设备采购

中国政府采购网消息,近日,广州市海珠区疾病预防控制中心就2025年第一批医疗设备采购项目发布中标公告。中标总金额为890.916万元。公告内容显示,此次采购的仪器设备涵盖质谱仪、色谱仪、固相萃取仪、流......

基因组大数据还原野猪横跨欧亚的百万年迁徙历程

近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......

基因组密码被解锁:深度学习模型破解非编码区奥秘

人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......

410万这家疾控中心采购一台高通量基因测序仪

 项目概况 上海市长宁区疾病预防控制中心(上海市长宁区卫生健康监督所)高通量自动化基因测序仪公开招标项目 招标项目的潜在投标人应在上海市政府采购网获取招标文件,并于202......

“女娲”基因组计划发布第八项成果

近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......

适应雨林?古人类混血?东南亚人群基因组被破译

中外团队历时10年,在东南亚人群基因组研究领域取得里程碑式突破。北京时间14日晚,“东南亚人群基因组计划”首期成果发表在国际期刊《自然》上,东南亚人群的遗传演化之谜被揭开。论文通讯作者之一、中国科学院......