发布时间:2023-10-27 10:59 原文链接: 中国科研团队研发出精准检测评估基因组组装新工具

  近年来,随着基因测序技术和算法不断发展,大量物种基因组被陆续测序和组装,为相关研究和应用提供重要遗传信息。因此,如何精准检测评估基因组组装质量高低、避免组装错误等非常关键,也备受关注。

  记者19日从中国科学院植物研究所获悉,该所焦远年研究团队最新研究开发出一种不依赖参考基因组的组装质量评估新工具CRAQ(Clipping information for Revealing Assembly Quality),可以在单碱基水平检测和评估基因组序列的精准度,并提供相关纠错方案。这一基因组研究领域的重要成果论文,近日在国际学术期刊《自然-通讯》上线发表。

  论文通讯作者焦远年研究员指出,高质量的参考基因组序列对于基因注释和相关功能研究至关重要,也是大规模比较基因组学和表观遗传调控研究的重要前提。不过,目前多数基因组序列中仍然存在一些组装错误,给相关研究带来一定程度影响。而精准区分和鉴定高质量与低质量的基因组序列,不仅可以为基因组组装质量提供评估依据和进一步改进提供靶点,也可以为后期比较基因组和功能研究位点提供基因组序列质量认证。当前,虽然已有一些基因组组装质量评估的方法和指标,但其大多仅提供一个总体的评估值,没有针对特定区域或碱基的评估信息。

  针对这一问题,该研究团队研发的CRAQ通过将原始测序序列比对到组装的基因组上,基于序列比对产生的有效“剪切对齐”信息,可精准地检测基因组中存在的组装错误。结合长读长测序片段和短读长测序片段与基因组比对的特征,CRAQ可以识别基因组内小规模的区域组装错误和大范围的结构组装错误,不同类别的错误数量经过统计和标准化处理后被转化为两个组装质量评估指标,以反映不同层面的基因组组装质量。

  同时,CRAQ能够将组装错误与基因组内的高杂合区域或单倍型差异区分开来,并在单碱基分辨率下指示低质量组装区域和潜在错误断点的位置。在此基础上,CRAQ能帮助研究人员识别基因组中存在的嵌合片段,并将这些片段准确地拆分,以利于结合光学图谱或构象捕获技术进一步构建结构更加准确的参考基因组。

  据研究团队介绍,为对CRAQ进行性能测试和评估,他们以人类参考基因组组装为基础构建一个模拟数据集并利用CRAQ和目前广泛使用的基因组质量评估工具进行测试和比较,结果表明,当缺乏完美参考基因组时,CRAQ表现最佳,并在检测杂合区域方面也表现出超过95%的召回率和精确度。研究团队还通过对一个真实的果蝇杂交的基因组数据集进行分析,发现CRAQ可以准确地将组装错误和杂合区域区分开来,而其他工具则无法检测出杂合区域。

相关文章

中国科研团队研发出精准检测评估基因组组装新工具

近年来,随着基因测序技术和算法不断发展,大量物种基因组被陆续测序和组装,为相关研究和应用提供重要遗传信息。因此,如何精准检测评估基因组组装质量高低、避免组装错误等非常关键,也备受关注。记者19日从中国......

中国科研团队研发出新工具,精准检测评估基因组组装质量

京10月19日电(记者孙自法)近年来,随着基因测序技术和算法不断发展,大量物种基因组被陆续测序和组装,为相关研究和应用提供重要遗传信息。因此,如何精准检测评估基因组组装质量高低、避免组装错误等非常关键......

科学家分析禽流感在21世纪的流行

10月18日发表在《自然》的一项研究报道了高致病性H5禽流感病毒在生态与演化上的主要变化,包括全球分布的变化。研究结果显示,这些病毒的暴发中心已经扩展到亚洲以外,传播到了非洲和欧洲的部分地区。2021......

Science:全基因组遗传筛选揭示了人类色素沉着的决定因素

斯坦福大学JoannaWysocka团队在Science在线发表题为“Agenome-widegeneticscreenuncoversdeterminantsofhumanpigmentation”......

研究发现广谱抗黑条矮缩病毒新基因

近日,中国农业科学院作物科学研究所玉米遗传改良与新品种选育创新团队发现了一个玉米抗粗缩病新基因ZmGLK36,并深入揭示了该基因编码的转录因子调控玉米抗粗缩病的分子机制,为抗粗缩病玉米育种等作物抗病改......

昆明植物所完成勐腊毛麝香高质量基因组的组装和萜类物质合成相关基因鉴定

近年来,热带传染病登革热盛行,对热带地区群众的生命健康造成威胁。然而,目前用于大面积喷洒以趋避和杀灭蚊虫的化工合成药品对人体和环境均存在二次伤害的风险,因而亟需发展能够有效驱避埃及伊蚊的天然绿色驱蚊产......

无缺口组装!水稻完整参考基因组发布

近日,中国农业科学院深圳农业基因组研究所联合海南崖州湾实验室、中国水稻研究所、中国农科院作物科学研究所和扬州大学等多个单位发布完整的水稻参考基因组,实现了全基因组所有染色体端粒到端粒无缺口组装,为水稻......

破解埃博拉病毒基因组从头起始复制的分子机制

9月12日,中国科学院微生物研究所施一、齐建勋、高福院士团队,在《自然》(Nature)上,发表了题为MolecularmechanismofdenovoreplicationbytheEbolavi......

遗传年龄或可评估自闭症和精神分裂症患者脑组织衰老速度!

自闭症(ASD)和精神分裂症(SCZ)是常见的慢性精神疾病,在行为、遗传学和神经病理学等方面存在相当多的重叠特征,提示自闭症和精神分裂症可能存在共同的神经发病机制。衰老与表观遗传效应的动态变化密切相关......

我国科研团队发布水稻完整参考基因组

水稻是重要的粮食作物,其基因组组装对水稻育种意义重大。23日,记者从中国农业科学院深圳农业基因组研究所获悉,该所联合崖州湾实验室、中国水稻研究所、中国农科院作物科学研究所和扬州大学等多个单位发布完整的......