Pacific Biosciences公司近日以单分子环形一致性测序(CCS)为基础开发出一种方案,能够在Sequel测序平台上生成高度准确的长reads。这种方法有望克服短读长测序的读长不足以及长读长测序的准确性有限的问题。
这篇题为“Highly-accurate long-read sequencing improves variant detection and assembly of a human genome”的文章于近期发表在预印本网站bioRxiv上。
第一作者、PacBio生物信息学部门的首席科学家Aaron Wenger表示,这项研究是在2018年年中开展的。他们的最初想法是开发出一种方法来改善reads,但Wenger和他的同事并不知道如何整合长读长和短读长测序的不同用法。
“一开始,我们的想法是让长reads变得更加准确,就像短reads一样,这样人们就能够将为短reads开发的软件应用在这些更长、更准确的reads上,”Wenger解释说。从某种程度上说这没错,但事情并不像Wenger预想的那样。
“尽管准确长reads和短reads的错误率相似,但这两种数据之间的错误类型是完全不同的,而软件必须意识到这一点,”Wenger说。
短读长测序中的错误往往是DNA中的某个碱基出错,比如明明是个T,出来却是个A。长读长测序则明显不同,它可能会漏掉某个碱基或增加一个碱基。
“如今,人们对市场上各种测序仪的看法是,短读长测序仪只能观察小片段DNA,但它们特别准确,长读长测序仪能够观察数万个碱基,但每十个碱基中就有一个错误,”Wenger说。于是,他和同事努力去生成又长又准确的reads。
后来,他们利用CCS技术实现了这一点。这种测序技术是PacBio多年前开发的,它将DNA变成环形,这意味着研究人员能够对DNA进行多次测序,最终形成一致性序列。
据Wenger介绍,之前没有使用CCS技术,是因为它处理的数据量存在限制。“CCS通常仅限于较短的DNA片段,因为如果是15,000 bp的DNA片段,测序十次,那么这就意味着你要读取150,000 bp的原始DNA,”他说。
然而,PacBio的试剂在2018年下半年经过了升级,能够带来非常长的reads。这样,研究团队就能够多次观察长片段的DNA。
于是,他们将这项技术应用于瓶中基因组联盟(Genome in a Bottle Consortium)的参考基因组——人类男性HG002样本。测序结果表明,覆盖度达28倍,平均读长为13.5 kb,且准确性高达99.8%。
“(原先的)参考序列是利用短读长测序建立的,”Wenger谈道。“令人惊喜的是,我们能够利用这种新的数据类型来校正参考序列中的许多错误。”
当然,光靠PacBio的努力还不够。在收集到原始数据后不久,PacBio就与Google(谷歌)分享了他们的结果,希望利用Google的DeepVariant软件来检出长片段中的变异。在此之前,他们尝试使用了Broad研究所的GATK软件。Wenger表示GATK的结果还不错,但不如处理短片段时那么强大。
Google软件能够直接适应长且准确的序列数据,而GATK需要手写代码。“我们能够使用Google的机器学习方法,并且弄清楚哪些错误是插入缺失错误,而哪些又是替换错误,”Wenger说。
在Google处理了数据之后,PacBio又召集了其他研究机构来分析结果,以便改善流程。具体包括约翰•霍普金斯大学、国家人类基因组研究所(NHGRI)和Dana-Farber癌症研究所。
Wenger表示,对于数据处理,目前还有很多工作要做。PacBio正在努力以更轻松、更低成本的方式产生数据。
近日,PacBio(纳斯达克股票代码:PACB)公布了2024年Q4及全年财务业绩。PacBio2024年Q4营收为3920万美元,较上年同期5840万美元下降33%;2024年收入为1.54亿美元,......
基因组信息在生命科学研究中具有重要价值。基于三代长读长的测序组装越来越广泛地应用于基因组学研究。其中,PacBio高保真测序技术因高精度的测序质量被认为是三代测序的金标准。然而,PacBio标准建库方......
基因组信息在生命科学研究中具有重要价值。基于三代长读长的测序组装越来越广泛地应用于基因组学研究。其中,PacBio高保真测序技术因高精度的测序质量被认为是三代测序的金标准。然而,PacBio标准建库方......
近日,PacBio(纳斯达克股票代码:PACB)公布截至2023年12月31日的季度和财年的财务业绩。2023年收入为2.005亿美元,与去年同期的1.......
在生物多样性急剧减少和物种消失的时代,有时被称为“第六次大灭绝”或“全新世灭绝”,人们对开发有效的生物多样性研究和监测工具提出了很高的要求。迄今为止,世界各地的分类学家已经描述了超过170万个物种。然......
PacificBiosciences公司本周一表示,在第三季度收入同比增长77%之后,该公司上调了2023年全年收入预期。公司预计2023年总收入在1.......
Take2和香港中文大学起诉PacificBiosciences,指控其侵犯了一项涉及甲基化DNA碱基调用方法的ZL。在周二向美国证券交易委员会提交的文件中,PacBio披露了去年12月在美国特拉华州......
PacificBiosciences近日发布2022年财政报告,由于用户等待该公司最新的Revio长读长测序仪导致其他测序仪器需求下降,其2022年第四季度收入同比下降24%。2022年收入1.28亿......
当地时间2019年12月17日,美国联邦贸易委员会(FederalTradeCommission,FTC)宣布已授权采取行动,以阻止Illumina提出的以12亿美元收购PacBio的交易。FTC在一......
2018年11月,基因测序巨头Illumina拟对PacBio的12亿美元收购案一度引发全球基因测序行业的广泛关注。通过将Illumina的短读长测序技术和PacBio的长读长测序技术相结合,这项交易......