发布时间:2016-10-20 10:23 原文链接: Nature:借助第三代测序韩国发表最连续人类基因组

  国立首尔大学医学院的研究人员和美国被誉为“测序黑马”的公司——10x Genomics联合运用去年新发售的GemCodeTM测序平台以及第三代测序PacBio单分子实时测序平台在本期的Nature上发表了一项新的研究,对一名韩国人的基因组(AK1)进行从头组装和单倍体型定相信息分析。这是迄今为止发表的最为连续的人类基因组组装。作者填补了特异人群参考基因组的空白,并确定了结构变异。

  该研究的显著改进

  这项工作提供了了到目前为止最邻近的二倍体基因组装配与之前未报道的亚洲特异结构变异的广泛调查。其优质的临床相关的等位基因的单体型分析有着提高精准医疗的潜力。这对于目前基于欧洲人和白人人群的基因组分析方法,是一个显著的改进。这个方法提高了从一个个体的短读长序列比对形成到一个单倍体的一致性参考基因组的分析状况,调整了通常无法捕捉到相对于个体基因组或种族人群属于新序列的问题。

  主要研究方法

  GemCode平台能够与现有的短读取测序仪互补,产生长片段信息(10-100 kb),实现结构变异和单体型等分析。为了更全面了解结构变异的范围和更好地理解AK1二倍体基因组结构的相,研究者对从PacBio单分子实时测序reads组装得到的,每个染色体单倍型的装配体——“haplotig”进行从头组装。除了PacBio长读长测序,该研究还使用了Illumina短读长测序、10X Genomics连接读取、细菌人工染色体(BAC)测序和BioNano Genomics光学图谱。Contig N50达到17.9Mb,Scaffold N50达到44.8Mb。

实验设计及数据分析流程

  数据上的提升

  到目前为止该研究在之前最佳的N50长度上提高了18Mb,最大的91个scaffold覆盖了基因组的90%,8个染色体的臂是由单个scaffold构成的。研究人员用AK1的组装序列补齐了在人类参考基因组GRCh38上的190个空缺中的105个,补齐的序列由364kb变成1.5Mb。另外也将剩下的85个空缺中的72个从663kb补充到4.1Mb。该研究鉴定到的18,210个结构变异,包含7,358个删除,10,077个插入,71个转换和704个复杂变异,所有这些变异均在AK1组装结果和人类参考基因组GRCh37之间进行了直接比较,达到了单碱基的分辨率。在18,210个结构变异中,总共有11,927个变异是以前未曾报道的。

AK1 de novo assembly Scaffolds与GRCh38的数据结果进行比较

  测序新技术的强大作用

  这项研究的结果显示了测序新技术在从头基因组组装和“真正的”二倍体定相方面的强大能力,可以用来检测全方位的遗传变异和了解临床相关基因的单倍体的结构。这项基因包括:主要组织相容性复合体(MHC)的人类白细胞抗原(HLA)的基因变异,对药物基因组非常重要的CYP2D6基因,以及罕见的常染色体隐性遗传疾病,如家族性地中海热、Upshaw–Shalman综合征中涉及到的基因。

  该项研究的领导者,国立首尔大学医学院的Jeong Sun Seo医生说:“10x Genomics的GemCode平台和有针对性的BAC克隆测序在这项研究中成功单倍体定相是必不可少的。”

  10x Genomics的联合创始人和首席执行官SergeSaxonov说:“从头装配和定相就像十字瞄准线一样是我们的主要目标。我们的技术非常适合于临床和人群规模的测序。”

人类基因组从头组装及单倍体型定相信息总结统计

  作者在文章中还比较了目前已有的人类基因组组装的测序平台、算法、组装和定相统计数据。该列表表明,单分子长读长测序技术在生成高质量组装数据上远超过短读长测序技术。这项研究清楚地表明了第三代测序长读长技术结合GemCode测序平台解决单倍型的从头组装方法的潜力,并揭示了以前未被发现的新的遗传变异,将迎来人类基因组测序的新标准。

相关文章

科学家揭示人类基因组古病毒复活驱动衰老

病毒与人类之间的协同进化关系源远流长,二者之间的交锋从未随时间停止过。在这场旷日持久的战争中,一方面,病毒使人类饱受疾病困扰,甚至死亡,并在此过程中对人类基因组不断地利用与改造;另一方面,人类的免疫系......

首个完整人类基因组序列公布

 由美国国家人类基因组研究所、加利福尼亚大学圣克鲁斯分校、华盛顿大学等机构研究人员领衔的国际科研团队3月31日公布了首个完整、无间隙的人类基因组序列。与这项重大成果相关的6篇论文当天发表在美......

DNA重组广泛存在人类基因组中

科技日报北京7月26日电(记者张梦然)日本理化学研究所综合医学科学中心科学家主导的国际合作研究发现,在人类每个细胞的基因组中,重复数百万次的特定基因组序列重组普遍存在于正常细胞和疾病状态的细胞中。确定......

这一基因组序列除了加速人类进化,还具有另一重要作用

哈佛医学院研究人员团队已经证明,参与人类神经发育的调节增强剂在人类基因组的快速进化部分中尤为常见。这些区域被称为人类加速区,或HAR,包含与其他动物相比人类进化得更快的基因,并被认为有助于大脑皮层的进......

破译“生命天书”20年:基因组时代曙光初现

2001年2月15日,被称为破译“生命天书”的人类基因组序列草图正式发表。20年前,我国科学家参与并完成国际“人类基因组计划”(HGP)1%的任务,使我国成为世界上少数几个能独立完成大型基因组分析的国......

20年前人类基因组测序时遗漏的8%的基因组被补全!

人类基因组计划(HumanGenomeProject,HGP)被誉为生命科学的“登月计划”。2001年,由HGP和Celera公司之间相互竞争而又各自独立完成发表了人类基因组草图,被认为是一大里程碑。......

“人类基因组图谱”20年——30亿碱基“拼出”大科学时代

20年前,2001年2月,被誉为生命科学“登月计划”的“人类基因组计划”(HGP)发布首张人类基因组图谱。这是人类生命科学发展历史上的重要“分水岭”。20年来,曾作为单一学科独立发展的生命科学迎来多学......

日本量子密码通信技术传送人类基因组实验成功

据日本《共同社》获悉,日本东芝公司和日本东北大学东北MedicalMegabank机构(仙台市)近日宣布,成功开展了利用可防止信息被偷窥的新一代技术“量子密码通信”传送人类遗传信息(基因组)完整数据的......

你到底有多少基因?科学家公布人类基因数量引发争议

在人类基因组项目完成十多年后,辨别基因仍是一项挑战。估测人类基因组中基因数量的最早尝试涉及喝醉酒的基因学家、美国纽约冷泉港的一个酒吧以及纯粹的臆测。那是2000年。当时,人类基因组序列草图仍在绘制中。......

科学家公布人类基因数量引发争议

估测人类基因组中基因数量的最早尝试涉及喝醉酒的基因学家、美国纽约冷泉港的一个酒吧以及纯粹的臆测。在人类基因组项目完成十多年后,辨别基因仍是一项挑战。那是2000年。当时,人类基因组序列草图仍在绘制中。......