发布时间:2019-01-25 14:19 原文链接: 长读长组装错误更多?两派学者起争论

  近日,英国爱丁堡大学的研究人员对三个利用长读长测序技术组装的人类基因组进行分析。他们发现,与短读长组装相比,这些长读长组装的蛋白编码区域含有相当多的错误。他们在《Nature Biotechnology》上发表结果,并建议人们花大力气去解决这些错误。

  文章的共同作者Mick Watson和Amanda Warr表示:“对于那些准备利用单分子技术来测序基因组以及希望在临床实践中使用长读长技术的研究人员来说,这些结果可能具有警示作用。”

  然而,参与长读长组装的研究小组之一在同期杂志上进行了回应,对这些结果提出了质疑。他们认为,新的生物信息学工具已经改善了纳米孔组装,并且“算法和技术的进一步改进将能够从Oxford Nanopore和PacBio数据中获得参考级的一致序列”。

  在这项研究中,Watson和Warr对五个已发表的人类基因组组装进行比较。其中两个是只利用PacBio序列组装的(2015年和2017年),一个是利用Oxford Nanopore和Illumina序列组装的(2018年),另外两个则是只利用Illumina短读长序列组装的(2011年和2014年)。

  他们将这些组装与一组41,000条mRNA转录本进行比较,发现长读长组装在蛋白编码区域的插入缺失错误明显多于短读长组装。特别是早期的PacBio组装,近11,000个基因存在indel错误,而新的PacBio组装仅有740个。对于Illumina-纳米孔组装,近4,000个基因存在indel错误,而两个Illumina组装分别是400个和600个。

  研究人员指出,最近PacBio组装的大幅改进证明,它能将出错的蛋白编码区域降低至几百个,不过需要注意这样做所需的资源和技能。此外,Oxford Nanopore组装虽然使用Illumina reads进行校正,但在蛋白编码区域仍然存在大量的indel错误,这值得那些使用纳米孔组装的研究人员留意。

  Watson和Warr解释说,他们的分析“不应被认为是对PacBio或Oxford Nanopore的批评,也不是比较各种测序技术。相反,它只是尝试利用已发表的人类基因组组装来证明indel错误仍然普遍存在,这可能影响蛋白编码转录本和基因”。

  然而,其他人似乎有不同的看法。伯明翰大学Nick Loman和诺丁汉大学Matt Loose领导的研究团队在同期杂志上发表回复文章,认为爱丁堡研究人员错误地关注了他们之前论文中的组装,它所使用的碱基识别工具已过时。

  他们最近利用更新的碱基识别工具重新组装了原始的纳米孔数据。他们表示,新工具改善了组装的连续性,且纳米孔数据的一致准确性达到99.77%。同时,他们还用两种不同的工具进行几轮polishing,更新了纳米孔和Illumina数据的组装,一致准确性达99.99%。

  研究人员认为,组装不仅仅应根据错误率来判断,还要考虑其连续性、是否存在错误组装以及其他指标。他们表示,从各种组装质量指标来看,长读长测序技术可以产生明显改进的组装。

  Watson和Warr也同意这个观点,“长读长已经改变了基因组组装,我们相信它们将成为所有新基因组组装项目的起点”。例如,脊椎动物基因组计划打算使用四种互补技术,包括PacBio测序,产生长reads或其他长距离映射信息。

  不过,他们坚持认为,为了最大限度提高长读长组装的准确性,大家应进行多轮的polishing,并检查其余的插入缺失和错误,包括手动检查和错误纠正。


相关文章

修复蛋白质生产错误能延长寿命

英国伦敦大学学院和英国医学研究理事会(MRC)伦敦医学科学研究所的研究人员在简单模式生物中进行的一项新研究发现,减少蛋白质合成(生产)中的自然错误可以改善健康和延长寿命。14日发表在国际著名期刊《细胞......

DNA复制叉稳定机制研究

解开50年谜题“DNA复制错误主要来自DNA复制叉的不稳定。”孔道春对《中国科学报》说,“揭示checkpoint调控维持停顿复制叉稳定的核心分子机制,找到DNA复制叉不稳定的原因,人们就可以有的放矢......

gcms出现传感器错误及常见问题解答

一、气相色谱仪主要组成部分气相色谱主要包括气体、进样系统、色谱柱、检测器和数据系统五部分。其中载气是用于传送样品通过整个系统的气体。进样系统的作用是将样品汽化并引入载气流中,其分为进样口类型和进样方式......

这5个错误可能会加剧冠状病毒的爆发

每个人都需要尽自己的一份力量来阻止这种新型冠状病毒的传播,这种病毒被称为SARS-CoV-2。但是,在不确定的时候,很容易犯错误。最大的问题是,如果你把病毒传播给其他人,尤其是那些免疫系统受损的人,会......

长读长组装错误更多?两派学者起争论

近日,英国爱丁堡大学的研究人员对三个利用长读长测序技术组装的人类基因组进行分析。他们发现,与短读长组装相比,这些长读长组装的蛋白编码区域含有相当多的错误。他们在《NatureBiotechnology......

湖南永州市江永县市场和质量监管局处罚裁量引争议

检验机构错误使用标准检出错误结论,行政执法部门在多次被告知检验结果错误的前提下,依旧对生产单位进行加倍处罚。湖南省永州市政府职能部门对企业的“重点关照”令人费解。2016年5月26日,永州市江永县市场......

Cell子刊:癌症发展的一种免疫机制

有时候,当免疫系统发生小错误时,身体将大规模地扩大其响应:发育中的T细胞和B细胞的DNA编辑错误,可引起血液肿瘤。现在,来自宾夕法尼亚大学佩雷尔曼医学院的研究人员表明,当切割和粘贴DNA片段的关键酶,......

Nature&Genes&Dev&EMBOJ:肠癌背后的基因错误

随着肿瘤产生发展错误就会频频出现,而且每次一旦细胞分裂产生产生两个细胞,这些错误就会发生改变而且不断变得多样化;但在某些时候早期事件引发的癌症通常会被直接发现,就拿肠道癌来说,科学界在几乎30年来都认......

SCI论文投稿时避免犯的十大错误

在进行SCI论文投稿时,会遇到的十大问题;请注意这不是拒稿的原因,但如果能排除这些项目,文章或许可能会发表,不过这些错误绝对会导致审稿时间无预期的延迟。以下为错误列表,依最常见的项目依序排列:1.未完......

法植物生物学领袖被指学术不端

当调查发现其研究存在学术不端行为后,法国国家科研中心(CNRS)——欧洲最大的基础研究机构——暂停了植物生物学领军人物OlivierVoinnet的职务。该机构发言人JulienGuillaume近日......