发布时间:2019-12-02 16:15 原文链接: 基因组研究的“98K”——人工智能算法

  每个分子遗传学家都希望找到一个易于使用的程序,可以比较来自不同细胞条件的数据集,识别增强子区域,然后将其分配给目标基因。

  如今,柏林马克斯·普朗克分子遗传学研究所的马丁·温格隆(Martin Vingron)领导的研究小组现已开发出一个掌握所有这些内容的程序。 “ DNA非常无聊,因为它在每个细胞中几乎都一样。如果将基因组比作生命之书,那么我对旁注则更感兴趣。”这些“旁注”是指附着在DNA分子上的小化学标记,它们不会改变遗传信息本身,但会影响相应位点上DNA发生的变化。换句话说,这些标记具有表观遗传作用。它们充当负责启动子和增强子等基因激活和失活的基因组区域的调节剂。

  在许多复杂的疾病中,基因的表观遗传控制无法正常工作,这对科学家非常感兴趣。然而,在实验室中对这些区域的分析通常是麻烦,费时且复杂的。这就是为什么Vingron和他的团队决定开发一个新的程序包的过程。

  该程序包称为条件特定的调节单元预测(CRUP),它可以简化分析并解决一些实际问题。开发该软件包的生物信息学家Verena Heinrich说:“我们希望通过一个简单的通用程序将增强子预测过程中的常见步骤结合在一起。” CRUP在许多方面简化了分析。机器学习算法不限于特定的细胞或组织类型。无需在每次分析数据集之前重新校准它,并且可以对多个数据系列进行比较研究。该工具由Heinrich和博士生Anna Ramisch开发,仍然易于使用。

  CRUP专门鉴定和表征增强子-刺激或“增强”基因转录的DNA片段。这些区域吸引附着在启动子序列上的蛋白质,该启动子序列充当每个基因的开关。然而,哪种增强子在正确的时间控制正确的基因通常仍然是一个谜。

  基因组包含成千上万个增强子,它们在细胞生命的不同阶段(如生长,维持或疾病期间)具有活性。当DNA像羊毛线一样紧密地堆积在称为组蛋白的载体蛋白线轴上时,调节序列处于“静止”状态。它们仅通过对组蛋白的化学修饰而产生影响。

  这些ChIP数据是新开发程序的初始输入值。 CRUP首先检查所有序列,然后判断它是否是增强子。分类算法基于使用小鼠胚胎干细胞的信息进行训练的人工智能产生。正如Heinrich和她的同事在德国表观基因组计划(DEEP)提供的一系列数据中所展示的那样,它可以检测许多其他动物物种或组织中的增强子区域。

图片.png

(图片来源:Www.pixabay.com)

  在第二步中,可以向CRUP导入多个数据集,程序会找到它们之间的区别。这使得可以解释一系列的测量结果或查明组织之间的差异。随着时间的流逝,或者在比较健康和患病的组织时,增强子的表观遗传变化变得显而易见。分析的第三步也是最后一步是将基因映射到它们各自的增强子。为了实现这一目标,CRUP将增强子分析与转录数据联系起来,转录数据揭示了哪些基因是活跃的,而实验则表明了DNA链的哪些部分彼此靠近。

  最后,研究人员在实际环境中测试了他们的程序。他们分析了患有免疫性类风湿关节炎的小鼠的组织,并将其与健康动物的数据进行了比较。 CRUP确定了增强子区域中的200多个差异,其中一些在其他研究中已经与该疾病相关。 CRUP分配给这些增强子的基因也已显示在疾病中起作用。

  Vingron说:“我们的程序可靠地识别出与疾病相关的增强子的候选物,并将其与靶基因联系起来。”他的团队希望该新工具将使该领域更容易使用,并加快研究速度,以帮助确定复杂的人类疾病的原因。


相关文章

科学家利用人工智能在天文大数据应用研究领域获进展

中国科学院上海天文台研究员葛健带领的国际团队,运用人工智能的深度学习方法,对国际斯隆巡天三期释放的类星体光谱数据进行了微弱信号搜寻和数据分析,发现了稀少的107例宇宙早期星系内的冷气体云块成分的关键探......

科学家利用人工智能在天文大数据应用研究领域获进展

5月15日,上海天文台研究员葛健带领的国际团队运用人工智能的深度学习方法,对国际斯隆巡天三期释放的类星体光谱数据进行了微弱信号搜寻和数据分析,发现了稀少的107例宇宙早期星系内的冷气体云块成分的关键探......

人工智能加速赋能千行百业

工业和信息化部日前公布数据显示,我国人工智能发展取得积极进展,企业数量超4500家,智能芯片、通用大模型等创新成果加速涌现,智能基础设施不断夯实,数字化车间和智能工厂加快建设,为人工智能赋能新型工业化......

《“动物基因编辑产业促进”倡议书》发布

近日,第二届(2024)动物基因编辑抗病育种专题研讨会在北京举行。研讨会现场。主办方供图研讨会上,《“动物基因编辑产业促进”倡议书》发布。中国工程院院士、中国科学院亚热带农业生态研究所首席研究员印遇龙......

2024年“河南省企业科技领军人才综合能力提升培训班”

2024年4月14日-20日,河南省科学技术厅在复旦大学成功举办2024年“河南省企业科技领军人才综合能力提升培训班”。来自河南省2020、2021年度“中原科技创业领军人才”、“中原产业创新领军人才......

中关村丰台园园区企业获批丰台区第一家外资研发总部

近日,在园区管委和区商务局的共同努力下,园区企业北京智云悟飞科技有限公司通过北京市外资研发总部认定,成为丰台区第一家外资研发总部。北京智云悟飞科技有限公司成立于2021年9月2日,是香港智齿博创科技有......

《北京市人工智能大模型行业应用分析报告》发布

2024年4月27日,北京市科学技术委员会、中关村科技园区管理委员会在2024中关村论坛年会-未来人工智能先锋论坛上发布了《北京市人工智能大模型行业应用分析报告》(以下简称《分析报告》)。《分析报告》......

一名患儿在临床试验中死亡,辉瑞DMD基因疗法再遇挫

·一名杜氏肌营养不良患者在2期临床试验中去世,死于心脏骤停。这是辉瑞第二次宣布其DMD基因治疗药物fordadistrogenemovaparvovec在临床试验中出现死亡事件。当地时间2024年5月......

专家热议以信息技术助推产业升级

“电子信息产业作为国民经济的战略性、基础性和先导性产业,是形成新质生产力的中坚力量。”以“信息科技·新质生产力”为主题、由中国电子学会举办的第十七届中国电子信息年会近日在浙江省宁波市开幕,工业和信息化......

当ChatGPT遇上CRISPR

在探索CRISPR基因编辑系统的过程中,研究人员从温泉、泥炭沼泽、粪便甚至酸奶中搜寻各种微生物。现在,由于生成式人工智能的进步,他们可能只需按一下按钮就能设计出这些系统。据《自然》报道,日前,研究人员......