京10月19日电 (记者 孙自法)近年来,随着基因测序技术和算法不断发展,大量物种基因组被陆续测序和组装,为相关研究和应用提供重要遗传信息。因此,如何精准检测评估基因组组装质量高低、避免组装错误等非常关键,也备受关注。

  记者19日从中国科学院植物研究所获悉,该所焦远年研究团队最新研究开发出一种不依赖参考基因组的组装质量评估新工具CRAQ(Clipping information for Revealing Assembly Quality),可以在单碱基水平检测和评估基因组序列的精准度,并提供相关纠错方案。这一基因组研究领域的重要成果论文,近日在国际学术期刊《自然-通讯》上线发表。

CRAQ工具的整体流程示意图。中国科学院植物所 供图

  论文通讯作者焦远年研究员指出,高质量的参考基因组序列对于基因注释和相关功能研究至关重要,也是大规模比较基因组学和表观遗传调控研究的重要前提。不过,目前多数基因组序列中仍然存在一些组装错误,给相关研究带来一定程度影响。而精准区分和鉴定高质量与低质量的基因组序列,不仅可以为基因组组装质量提供评估依据和进一步改进提供靶点,也可以为后期比较基因组和功能研究位点提供基因组序列质量认证。当前,虽然已有一些基因组组装质量评估的方法和指标,但其大多仅提供一个总体的评估值,没有针对特定区域或碱基的评估信息。

  针对这一问题,该研究团队研发的CRAQ通过将原始测序序列比对到组装的基因组上,基于序列比对产生的有效“剪切对齐”信息,可精准地检测基因组中存在的组装错误。结合长读长测序片段和短读长测序片段与基因组比对的特征,CRAQ可以识别基因组内小规模的区域组装错误和大范围的结构组装错误,不同类别的错误数量经过统计和标准化处理后被转化为两个组装质量评估指标,以反映不同层面的基因组组装质量。

CRAQ检测并纠正组装嵌合片段示例。中国科学院植物所 供图

  同时,CRAQ能够将组装错误与基因组内的高杂合区域或单倍型差异区分开来,并在单碱基分辨率下指示低质量组装区域和潜在错误断点的位置。在此基础上,CRAQ能帮助研究人员识别基因组中存在的嵌合片段,并将这些片段准确地拆分,以利于结合光学图谱或构象捕获技术进一步构建结构更加准确的参考基因组。

  据研究团队介绍,为对CRAQ进行性能测试和评估,他们以人类参考基因组组装为基础构建一个模拟数据集并利用CRAQ和目前广泛使用的基因组质量评估工具进行测试和比较,结果表明,当缺乏完美参考基因组时,CRAQ表现最佳,并在检测杂合区域方面也表现出超过95%的召回率和精确度。研究团队还通过对一个真实的果蝇杂交的基因组数据集进行分析,发现CRAQ可以准确地将组装错误和杂合区域区分开来,而其他工具则无法检测出杂合区域。

相关文章

“女娲”基因组计划发布第五项成果

近日,“女娲”基因组团队重点阐释了适应性选择下非编码调控元件对表型演化的影响,相关研究发表于《分子生物学与进化》。这项工作是中国科学院生物物理研究所徐涛院士、何顺民研究员牵头的“女娲”(NyuWa)中......

一生中患病的几率或可预测,十种慢性病遗传风险估算更接近临床

通过分析基因组中数百万个微小的遗传差异,就可预测一个人一生中患某种疾病的几率。在过去的10年中,研究人员为数十种疾病制定了风险评分,希望有一天患者能利用这些信息来降低患病风险。在《自然·医学》杂志最新......

揭秘基因组“暗物质”

记国家自然科学基金重大研究计划“基因信息传递过程中非编码RNA的调控作用机制”在人类遗传信息传递过程中,非编码RNA不参与编码蛋白质,占全部RNA的98%,如同宇宙中神秘的“暗物质”,是生命活动调控的......

基因测序技术:就像考试做“问答题”

基因测序技术是人类探索生命奥秘的重要手段之一。随着测序技术的发展,通过测序技术对遗传信息的解码和基因组数据库的构建,人类不仅得以窥探生命的密码,更能从基因层面对人类疾病进行检测甚至干预。为进一步了解基......

聚焦生物医药领域,探讨前沿分析测试技术发展及应用

——生物医药前沿分析技术论坛在北京顺利召开2024年1月20日,生物医药前沿分析技术论坛在北京顺利召开。论坛由北京市科学技术研究院分析测试研究所(北京市理化分析测试中心)和北京市科学技术研究院前沿技术......

1442万,福建省农业科学院仪器采购项目公开招标

近日,福建省农业科学院近日发布了关于“福建省农业生物种质资源库项目种质资源相关仪器部分”的两则公开招标公告,公开采购高通量基因测序仪和农用软X射线仪等仪器,预算金额共计1442.0149万元。高通量基......

预算428万吉安市疾控中心采购三重四极杆气相色谱质谱联用仪

近日,吉安市疾病预防控制中心就三代基因测序仪、半自动核酸提取仪和三重四极杆气相色谱质谱联用仪、三合一多功能自动进样器进行公开招标,预算金额为428万元,详细信息如下:一、项目基本情况:项目编号:赣同创......

构建水稻基因组倒位变异图谱

近日,中国农业科学院深圳农业基因组研究所联合国内多家单位发布了迄今为止最大的水稻群体水平倒位变异图谱,并挖掘获得了新的水稻耐热优异等位基因,该研究对水稻育种改良具有重要意义。相关研究成果发表在《科学通......

基因组精确注释新方法:增强子鉴定新技术

近日,中国农业科学院深圳农业基因组研究所动物功能基因组学创新团队研发出增强子鉴定新技术。该技术与传统技术相比,平均分辨率提高了约10倍,为基因组的精确注释提供了新方法。相关研究成果发表在《核酸研究》(......

迈向CRISPR2.0,下一代基因编辑技术方兴未艾

美国食品药品监督管理局(FDA)本月稍早时间宣布,批准CRISPR/Cas9基因编辑疗法Casgevy上市,用于治疗12岁及以上镰状细胞贫血病患者。这是FDA批准的首款CRISPR基因编辑疗法。而11......