随着高精度长读长测序技术的出现,基因组难以组装的状态正在改变。《Nature Methods》杂志上近日发表了一篇文章,介绍了基因组组装项目如何受益于这种技术。
自测序技术问世以来,利用DNA序列的片段来组装人类、动植物或微生物的基因组就一直是难题。许多参考基因组都存在缺陷,如组装错误或存在缺口。人类参考基因组GRCh38就有数百个缺口,缺失了大约150 Mb的序列。
随着高精度长读长测序技术的出现,这种状态正在改变。《Nature Methods》杂志上近日发表了一篇题为“Long road to long-read assembly”的文章,介绍了基因组组装项目如何受益于这种技术。
01左中括号填补缺口左中括
文章作者Vivien Marx指出,填补基因组上的缺口可以帮助人们比较基因组之间的差异。这些方法不仅适用于人类基因组,也适用于其他生物,比如微生物和脊椎动物。去年,“端粒到端粒联盟(T2T)”成员公布了激动人心的新进展。他们利用CHM13hTERT细胞系,组装了X染色体和8号染色体的完整序列。
CHM13细胞来源于葡萄胎,具有单倍体人类基因组。联盟负责人之一Adam Phillippy表示:“当我们只需要组装一个基因组而不是两个基因组时,问题就大大简化了。”如今,他们已经几乎完成了整个CHM13基因组的组装,只剩下五个缺口。下一步打算完成二倍体人类基因组的从端粒到端粒组装。“从单倍体到二倍体,听起来并不困难,但实际上要复杂得多,”他说。
02左中括号对付着丝粒左中括号
着丝粒一直是极具挑战性的区域。在X染色体上,着丝粒的基本重复单元的长度为171 bp,而其串联重复序列正是12个单元的组合,长度约为2 kb。因为不容易克隆,这些卫星DNA的序列很难获得。T2T联盟另一名负责人Karen Miga表示,一些新的测序技术可以帮助他们实现目标,比如Oxford Nanopore和Pacific Biosciences。
测序之后还需要组装。将着丝粒及其重复序列组装起来,有点像在玩一块蓝天的拼图,简直让人无从下手。丹纳法伯癌症研究所Heng Li实验室开发出了基因组组装工具hifiasm,能够对付着丝粒。同时,加州大学圣地亚哥分校的Pavel Pevzner实验室最近也开发出了组装着丝粒的算法centroFlye。他表示,centroFlye是“通过在蓝天中寻找一小片白云来进行组装”。
03左中括号长长长读长左中括号
Pacific Biosciences和Oxford Nanopore都推出了长读长测序技术,读长超过了10 kb。以往的数据显示,这些技术很容易出错,但Phillippy认为,现在的情况已经大不相同。PacBio在2019年推出了基于环状共有序列(CCS)的测序模式,生成了高度准确的HiFi reads。他表示,这种技术在检测单个分子上的准确性高达99.9%。同时,与五年前相比,纳米孔测序的准确度也大大提高。
Pevzner认为,这两种技术都可以达到90%以上的准确度。“HiFi reads的错误率是每一千个核苷酸有几个错误。纳米孔的超长测序虽然没那么准确,但成本也较低。这种情况正在动态变化。”生物学家目前主要使用短读长技术,但他认为完整组装的未来属于长读长。
04左中括号组装工具左中括
文章也提到了一些常用的组装工具,如Falcon、Canu、wtdbg2等。不过在HiFi reads出现后,人们则主要采用HiCanu和hifiasm工具来进行基因组组装。此外,PacBio的IPA也是专为HiFi reads而优化的组装工具。
hifiasm的开发者Heng Li也是T2T联盟的成员之一。他认为,准确的长读长技术正在帮助人们解析单倍型。“没多少人意识到我们今天产生的hifiasm/HiCanu组装的质量比一年前高多了,简直就是白天和黑夜的区别。”他表示:“组装领域的目标是实现二倍体样本的从端粒到端粒组装,然后是多倍体基因组和宏基因组,它们更难组装。”
05左中括号泛基因组和宏基因组左中括
如今,人们已经不再满足于个人基因组研究,而是转向了人类泛基因组(pangenome)研究,即人类群体基因序列的总和。研究人员认为,高度精确的从端粒到端粒组装可更好地了解人类的多样性以及对当地环境的适应。最近涌现出的许多软件工具可帮助人们从组装结果中找到基因组差异。
对于宏基因组分析,研究人员往往将Illumina短片段与Oxford Nanopore长片段结合起来,并采用metaSPAdes和metaFlye等工具进行组装。利用这种方法,人们发现的细菌和古细菌数量增加了一倍以上,且数据表现出更大的系统发育多样性。
总的来说,作者认为,高精度的长读长测序正在大大促进基因组组装项目。
——本文转载自“理财周刊——财事汇”近日,华大智造(688114.SH)发布2024年度业绩快报,数据显示,公司全年实现营业收入32.10亿元,同比增长10.28%;归属于母公司所有者的净利润亏损5.......
为指导二代基因测序相关体外诊断试剂管理属性和管理类别判定,根据《医疗器械监督管理条例》《体外诊断试剂注册与备案管理办法》《体外诊断试剂分类规则》《体外诊断试剂分类目录》等,国家药监局综合司组织起草了《......
引言:一场技术与贸易交织的攻防战2025年3月4日,中国商务部宣布将美国基因测序巨头因美纳(Illumina,Inc.)列入“不可靠实体清单”,禁止其向中国出口基因测序仪。这一措施不仅是对美国单边关税......
财联社3月2日讯(记者郑炳巽)在因美纳公司(Illumina,Inc.)受制裁事件之后,国内基因测序行业......
2025年2月20日,在IND2025第五届感染疾病诊断技术及检测自动化建设论坛上,思昆生物正式发布新一代桌面式小通量测序仪SikunRapidGS480(以下简称“GS480)和AISPre3200......
2024年即将结束,中国基因测序行业的概括,可以说是先抑后扬。生物安全法案的困扰、国内需求疲软的担忧……一系列的外因,让资本市场对中国基因测序行业的未来充满分歧。当然,分歧归分歧,行业的基本面并没有外......
“就像研究天文学需要望远镜,研究生物学需要显微镜,研究基因需要用到基因测序仪。”华大集团国际发展事务副总裁熊韬近日接受21世纪经济报道记者专访时表示。今年11月,以“链接世界共创未来”为主题的第二届链......
10月15日,真迈生物南京公司启用揭牌仪式暨新品发布会在新区生物医药谷举行。中国科学院院士陈润生,市委常委、江北新区党工委书记陆卫东,江苏省药品监督管理局副局长陈和平,南京市科学技术局局长赵成军,江北......
世界上有这样一群人,他们不愿对视、不爱交流、不作回应,仿佛遥远夜空中的星星,沉浸在自己的世界里。他们是孤独症谱系障碍(以下简称孤独症)儿童,也被形象地称作“星星的孩子”。近年来,孤独症进入大众视野,但......
近日,中国科学院长春光学精密机械与物理所研究员吴一辉团队联合深海科学与工程研究所研究员杜梦然团队研制的深海生物基因测序仪海试成功。6月3日至9日,深海生物基因测序仪参加“探索二号”TS2-38-1航次......