发布时间:2019-12-02 08:15 原文链接: 基因组研究的“98K”——人工智能算法

  每个分子遗传学家都希望找到一个易于使用的程序,可以比较来自不同细胞条件的数据集,识别增强子区域,然后将其分配给目标基因。

  如今,柏林马克斯·普朗克分子遗传学研究所的马丁·温格隆(Martin Vingron)领导的研究小组现已开发出一个掌握所有这些内容的程序。 “ DNA非常无聊,因为它在每个细胞中几乎都一样。如果将基因组比作生命之书,那么我对旁注则更感兴趣。”这些“旁注”是指附着在DNA分子上的小化学标记,它们不会改变遗传信息本身,但会影响相应位点上DNA发生的变化。换句话说,这些标记具有表观遗传作用。它们充当负责启动子和增强子等基因激活和失活的基因组区域的调节剂。

  在许多复杂的疾病中,基因的表观遗传控制无法正常工作,这对科学家非常感兴趣。然而,在实验室中对这些区域的分析通常是麻烦,费时且复杂的。这就是为什么Vingron和他的团队决定开发一个新的程序包的过程。

  该程序包称为条件特定的调节单元预测(CRUP),它可以简化分析并解决一些实际问题。开发该软件包的生物信息学家Verena Heinrich说:“我们希望通过一个简单的通用程序将增强子预测过程中的常见步骤结合在一起。” CRUP在许多方面简化了分析。机器学习算法不限于特定的细胞或组织类型。无需在每次分析数据集之前重新校准它,并且可以对多个数据系列进行比较研究。该工具由Heinrich和博士生Anna Ramisch开发,仍然易于使用。

  CRUP专门鉴定和表征增强子-刺激或“增强”基因转录的DNA片段。这些区域吸引附着在启动子序列上的蛋白质,该启动子序列充当每个基因的开关。然而,哪种增强子在正确的时间控制正确的基因通常仍然是一个谜。

  基因组包含成千上万个增强子,它们在细胞生命的不同阶段(如生长,维持或疾病期间)具有活性。当DNA像羊毛线一样紧密地堆积在称为组蛋白的载体蛋白线轴上时,调节序列处于“静止”状态。它们仅通过对组蛋白的化学修饰而产生影响。

  这些ChIP数据是新开发程序的初始输入值。 CRUP首先检查所有序列,然后判断它是否是增强子。分类算法基于使用小鼠胚胎干细胞的信息进行训练的人工智能产生。正如Heinrich和她的同事在德国表观基因组计划(DEEP)提供的一系列数据中所展示的那样,它可以检测许多其他动物物种或组织中的增强子区域。

图片.png

(图片来源:Www.pixabay.com)

  在第二步中,可以向CRUP导入多个数据集,程序会找到它们之间的区别。这使得可以解释一系列的测量结果或查明组织之间的差异。随着时间的流逝,或者在比较健康和患病的组织时,增强子的表观遗传变化变得显而易见。分析的第三步也是最后一步是将基因映射到它们各自的增强子。为了实现这一目标,CRUP将增强子分析与转录数据联系起来,转录数据揭示了哪些基因是活跃的,而实验则表明了DNA链的哪些部分彼此靠近。

  最后,研究人员在实际环境中测试了他们的程序。他们分析了患有免疫性类风湿关节炎的小鼠的组织,并将其与健康动物的数据进行了比较。 CRUP确定了增强子区域中的200多个差异,其中一些在其他研究中已经与该疾病相关。 CRUP分配给这些增强子的基因也已显示在疾病中起作用。

  Vingron说:“我们的程序可靠地识别出与疾病相关的增强子的候选物,并将其与靶基因联系起来。”他的团队希望该新工具将使该领域更容易使用,并加快研究速度,以帮助确定复杂的人类疾病的原因。


相关文章

低深度高通量全基因组测序在产前诊断中的意义

胎儿染色体核型分析常被用于高危妊娠的产前检查中,随着技术的发展,染色体微阵列分析(chromosomalmicroarrayanalysis,CMA)在产前诊断中的应用也逐步推进,并成为检测高危妊娠中......

GenomeAsia100K最新数据公布!探索亚洲人基因数据的秘密

目前已经测序的人类基因组序列中约有6%的样本来自亚洲个体。而世界上约一半的人口是亚洲人。GenomeAsia100K项目成立于2016年,由Macrogen、盆唐首尔大学医院精准医疗中心、新加坡南洋理......

新型表观基因组技术——助力了解人体如何对抗疾病

关于疾病,以及我们的身体对疾病的反应方式,至今我们仍然知之甚少,部分原因在于人类基因组是一个完整的DNA组装体,我们每个人都有独一无二的序列。弗吉尼亚理工大学的一个研究小组近期研发了一种新的表观基因组......

研究人员发现与肥胖和代谢紊乱有关的基因片段

美国科研团队从冬眠动物的基因组中发现可能与肥胖和代谢紊乱有关的基因片段,未来有望开发出治疗人类相关疾病的新方法。冬眠的哺乳动物体内会蓄积大量脂肪,但苏醒后依然能保持健康。26日发表在美国《细胞报告》杂......

科学家发现导致大脑衰老的新标记基因

随着老龄化社会的到来,大脑衰老成为人们日益关心的话题。中国科学院昆明动物所研究人员利用来自4只年轻猕猴、3只老年猕猴44个脑区的547个转录组数据,研究了非人灵长类动物大脑老化的潜在分子遗传机制,并找......

中国台湾研究人员发现:调控特定基因改写再生记忆

台湾研究人员陈振辉及其研究团队日前公布的最新研究成果发现,经由调控特定基因的活性,可以改写动物的“再生记忆”。该项研究发现,当“再生记忆”受到影响后,斑马鱼再生的新尾鳍可以出现不同的大小和形状。这是科......

华中科大发文:为什么这些蛋白家族可以被预测出来?

华中科技大学生命学院宁康教授团队,联合软件学院薛志东教授团队和美国密歇根大学计算医学与生物信息系张阳教授团队,在利用微生物组大数据辅助预测蛋白质三维结构领域取得新突破。该联合团队研究成果《Fuelin......

我国学者研究发现了导致大脑衰老的新标记基因

随着老龄化社会的到来,大脑衰老成为人们日益关心的话题。中国科学院昆明动物所研究人员利用来自4只年轻猕猴、3只老年猕猴44个脑区的547个转录组数据,研究了非人灵长类动物大脑老化的潜在分子遗传机制,并找......

“设计婴儿”困难重重精确选择是关键!

自从体外受精和筛选遗传疾病胚胎的技术诞生以来,人们就一直对“设计婴儿”的想法感到担忧。但根据近日《细胞》发表的一项研究,选择由多个基因带来的特征的能力,而不是由单个突变导致的遗传疾病,可能比大多数人意......

自闭症和注意力缺陷多动症竟然存在相同的基因变异?

来自国家精神病学项目iPSYCH的研究人员发现,自闭症和注意力缺陷多动症(ADHD)在存在相同的基因变异。这一新知识进一步加深了我们对两种儿童精神病的生物学原因的认识。在丹麦,约有1%的学童患有自闭症......