发布时间:2017-05-08 15:10 原文链接: 科学家构建出目前最高质量的植物基因组参考序列

  随着PacBio单分子实时(SMRT)测序技术的发展,利用它已能够独立完成高质量基因组草图的组装。然而,这些草图序列中仍然存在多种错误,比如序列中会包含有很多嵌合体(即不同位置的序列连接到了一起)或是组装质量比较差的区域等,特别是重复序列区域有的没有组装出来,有的组装出来多个序列,而且这些错误通常也难以检测。另外,单纯利用SMRT测序还只能装出一个个的DNA小片段,而要连成整条染色体的序列,则需要借助于遗传图谱,或是最近发展的Hi-C技术。然而,简单利用这两个技术形成的染色体序列,仍存在很多的缺陷:(1)小的片段难以放到染色体上,导致形成的染色体序列上有大量的缺口;(2)放上的片段中包含有大量的顺序排列错误和序列的方向错误。这样形成的染色体用作参考基因组进行基因定位,容易漏掉基因或导致错误的定位。

  为了利用现有的技术进行高质量的植物基因组组装,中国科学院遗传与发育生物学研究所梁承志研究组与四川农业大学教授李仕贵合作,从2014年开始对一个籼稻基因组蜀恢498(R498)进行PacBio单分子测序,结合遗传图谱和fosmid文库测序,并利用了BioNano光学图谱的验证,最后得到一个长度为390.3 Mb的基因组,共由17个连续DNA片段(Super-Contig)组成,包括7条头尾相连的染色体和5条分成两个Super-Contig的染色体。蜀恢498的基因组是目前所有高等动植物中组装质量最高的基因组,除了5个着丝粒重复序列区域和其它少数几个串联重复序列区域,整个基因组都被组装了出来;其基因组完整性和连续性都大大高于日本晴及拟南芥等基因组,且有更低的错误率。这个结果也显示了籼稻的基因组大小不超过395 Mb。他们在R498序列中发现了两个核仁组织区,多于日本晴基因组的一个。通过比较两个基因组上的基因序列可以看出,超过2/3的基因有序列上的差异,两个基因组之间也含有大量的由于转座子独立插入导致的结构变异。此外,他们还组装出了一个完整的线粒体序列,发现了日本晴线粒体序列中的几个大的错误,也发现了目前日本晴基因组参考序列中错误地掺入了很多线粒体和叶绿体的序列。作为参考基因组,R498序列将被用于籼稻突变基因的定位,及籼稻群体的全基因组关联分析。蜀恢498基因组的完成,显示了在现有的技术条件下,得到一个接近完成并在染色体水平上具有连续序列的高质量参考基因组是可行的,对于提高目前高等动植物基因组的组装质量具有重要的指导意义。

  该项研究于5月4日在《自然-通讯》(Nature Communications)杂志在线发表(DOI:10.1038/ncomms15324)。梁承志研究组博士生杜会龙,工作人员于莹、马延飞、高强和曹英豪为该论文的共同第一作者。该文通讯作者是梁承志和李仕贵。该研究得到了中科院战略性先导专项和国家自然科学基金项目的资助。

蜀恢498和日本晴全基因的比较显示了染色体端粒的有无及二者之间的结构变异分布。


相关文章

迄今最古老植物基因组破译

一个国际科研团队对在利比亚撒哈拉沙漠考古遗址收集的新石器时代的西瓜种子进行测序,破译了迄今最古老的植物基因组。对6000年前的西瓜种子进行测序,为西瓜的驯化提供了新线索,有助研究如何增强西瓜的抗旱、抗......

中国学者运用Bionano光谱分析研究此类植物

被子植物分为四大核心分支,即ANA被子植物基部类群、木兰类植物、单子叶植物和真双子叶植物。马兜铃属(Aristolochia)是木兰类植物,该属的植物具有极强欺骗性的“诱捕—囚禁—释放”传粉系统,独特......

华大基因测序近700种植物的基因组

近日,华大基因的研究人员对云南瑞丽植物园内部及周边近700种植物的基因组进行了测序和分析。这项工作有助于推动地球生物基因组计划(EBP)以及万种植物基因组计划(10KP)。在华大基因研究院副院长刘心的......

PacBio构建目前最高质量的植物基因组参考序列

来自中科院遗传与发育生物学研究所,四川农业大学的研究人员发表了题为“Sequencinganddenovoassemblyofanearcompleteindicaricegenome”的文章,对一个......

PacBio构建目前最高质量的植物基因组参考序列

来自中科院遗传与发育生物学研究所,四川农业大学的研究人员发表了题为“Sequencinganddenovoassemblyofanearcompleteindicaricegenome”的文章,对一个......

PacBio构建目前最高质量的植物基因组参考序列

来自中科院遗传与发育生物学研究所,四川农业大学的研究人员发表了题为“Sequencinganddenovoassemblyofanearcompleteindicaricegenome”的文章,对一个......

科学家构建出目前最高质量的植物基因组参考序列

随着PacBio单分子实时(SMRT)测序技术的发展,利用它已能够独立完成高质量基因组草图的组装。然而,这些草图序列中仍然存在多种错误,比如序列中会包含有很多嵌合体(即不同位置的序列连接到了一起)或是......

科学家构建出目前最高质量的植物基因组参考序列

随着PacBio单分子实时(SMRT)测序技术的发展,利用它已能够独立完成高质量基因组草图的组装。然而,这些草图序列中仍然存在多种错误,比如序列中会包含有很多嵌合体(即不同位置的序列连接到了一起)或是......

科学家构建出目前最高质量的植物基因组参考序列

随着PacBio单分子实时(SMRT)测序技术的发展,利用它已能够独立完成高质量基因组草图的组装。然而,这些草图序列中仍然存在多种错误,比如序列中会包含有很多嵌合体(即不同位置的序列连接到了一起)或是......

科学家构建出目前最高质量的植物基因组参考序列

随着PacBio单分子实时(SMRT)测序技术的发展,利用它已能够独立完成高质量基因组草图的组装。然而,这些草图序列中仍然存在多种错误,比如序列中会包含有很多嵌合体(即不同位置的序列连接到了一起)或是......