发布时间:2019-03-01 13:23 原文链接: PacBio如何获得又长又准确的reads

  Pacific Biosciences公司近日以单分子环形一致性测序(CCS)为基础开发出一种方案,能够在Sequel测序平台上生成高度准确的长reads。这种方法有望克服短读长测序的读长不足以及长读长测序的准确性有限的问题。

  这篇题为“Highly-accurate long-read sequencing improves variant detection and assembly of a human genome”的文章于近期发表在预印本网站bioRxiv上。

  第一作者、PacBio生物信息学部门的首席科学家Aaron Wenger表示,这项研究是在2018年年中开展的。他们的最初想法是开发出一种方法来改善reads,但Wenger和他的同事并不知道如何整合长读长和短读长测序的不同用法。

  “一开始,我们的想法是让长reads变得更加准确,就像短reads一样,这样人们就能够将为短reads开发的软件应用在这些更长、更准确的reads上,”Wenger解释说。从某种程度上说这没错,但事情并不像Wenger预想的那样。

  “尽管准确长reads和短reads的错误率相似,但这两种数据之间的错误类型是完全不同的,而软件必须意识到这一点,”Wenger说。

  短读长测序中的错误往往是DNA中的某个碱基出错,比如明明是个T,出来却是个A。长读长测序则明显不同,它可能会漏掉某个碱基或增加一个碱基。

  “如今,人们对市场上各种测序仪的看法是,短读长测序仪只能观察小片段DNA,但它们特别准确,长读长测序仪能够观察数万个碱基,但每十个碱基中就有一个错误,”Wenger说。于是,他和同事努力去生成又长又准确的reads。

  后来,他们利用CCS技术实现了这一点。这种测序技术是PacBio多年前开发的,它将DNA变成环形,这意味着研究人员能够对DNA进行多次测序,最终形成一致性序列。

  据Wenger介绍,之前没有使用CCS技术,是因为它处理的数据量存在限制。“CCS通常仅限于较短的DNA片段,因为如果是15,000 bp的DNA片段,测序十次,那么这就意味着你要读取150,000 bp的原始DNA,”他说。

  然而,PacBio的试剂在2018年下半年经过了升级,能够带来非常长的reads。这样,研究团队就能够多次观察长片段的DNA。

  于是,他们将这项技术应用于瓶中基因组联盟(Genome in a Bottle Consortium)的参考基因组——人类男性HG002样本。测序结果表明,覆盖度达28倍,平均读长为13.5 kb,且准确性高达99.8%。

  “(原先的)参考序列是利用短读长测序建立的,”Wenger谈道。“令人惊喜的是,我们能够利用这种新的数据类型来校正参考序列中的许多错误。”

  当然,光靠PacBio的努力还不够。在收集到原始数据后不久,PacBio就与Google(谷歌)分享了他们的结果,希望利用Google的DeepVariant软件来检出长片段中的变异。在此之前,他们尝试使用了Broad研究所的GATK软件。Wenger表示GATK的结果还不错,但不如处理短片段时那么强大。

  Google软件能够直接适应长且准确的序列数据,而GATK需要手写代码。“我们能够使用Google的机器学习方法,并且弄清楚哪些错误是插入缺失错误,而哪些又是替换错误,”Wenger说。

  在Google处理了数据之后,PacBio又召集了其他研究机构来分析结果,以便改善流程。具体包括约翰•霍普金斯大学、国家人类基因组研究所(NHGRI)和Dana-Farber癌症研究所。

  Wenger表示,对于数据处理,目前还有很多工作要做。PacBio正在努力以更轻松、更低成本的方式产生数据。


相关文章

继英国之后,Illumina收购PacBio再受美国监管机构反对

当地时间2019年12月17日,美国联邦贸易委员会(FederalTradeCommission,FTC)宣布已授权采取行动,以阻止Illumina提出的以12亿美元收购PacBio的交易。FTC在一......

Illumina收购PacBio恐受阻!曾提出向三方授权相关知识产权

2018年11月,基因测序巨头Illumina拟对PacBio的12亿美元收购案一度引发全球基因测序行业的广泛关注。通过将Illumina的短读长测序技术和PacBio的长读长测序技术相结合,这项交易......

英机构提议阻止Illumina收购PacBio维护测序市场公平竞争

大约一年前,美国基因测序巨头Illumina宣布了其20年发展史上最大的一笔交易,一时震惊了整个基因测序行业。2018年11月,Illumina与英国三代测序上游制造商PacBio宣布签署了一项收购协......

三代测序技术实现44倍测序序列连续性提升

2019年9月3日,PNAS(美国科学院院报)在线发表了上海交通大学王文琴副教授团队课题组题为“Plantevolutionandenvironmentaladaptationunveiledbylo......

PacBio如何获得又长又准确的reads

PacificBiosciences公司近日以单分子环形一致性测序(CCS)为基础开发出一种方案,能够在Sequel测序平台上生成高度准确的长reads。这种方法有望克服短读长测序的读长不足以及长读长......

PacBio如何获得又长又准确的reads

PacificBiosciences公司近日以单分子环形一致性测序(CCS)为基础开发出一种方案,能够在Sequel测序平台上生成高度准确的长reads。这种方法有望克服短读长测序的读长不足以及长读长......

PacBio技术助力两种水生生物的基因组组装

对于吃货而言,水生动物是餐桌上的美味。对于科学家而言,它们则具有重要的研究价值。了解它们如何适应不同的环境条件,对水产养殖业而言具有重大意义。为此,科学家们近日对两种水生动物进行了基因组组装。章鱼一向......

鱼和熊掌兼得,PacBio获得高度准确的长reads

如今,人类基因组的测序已经达到群体规模,但仍需要结合不同的测序技术(短读长和长读长),才能覆盖各种类型的遗传变异。这无疑增加了测序项目的成本和复杂度。为此,PacificBiosciences公司的研......

鱼和熊掌兼得,PacBio获得高度准确的长reads

如今,人类基因组的测序已经达到群体规模,但仍需要结合不同的测序技术(短读长和长读长),才能覆盖各种类型的遗传变异。这无疑增加了测序项目的成本和复杂度。为此,PacificBiosciences公司的研......

Illumina斥资12亿美元收购PacBio加速基因测序行业整合

2018年11月1日,Illumina公司宣布收购PacificBiosciences公司。Illumina将以后者每股8美元的价格以全现金交易的形式收购该公司。这一价格比PacificBioscie......