发布时间:2019-12-02 16:15 原文链接: 基因组研究的“98K”——人工智能算法

  每个分子遗传学家都希望找到一个易于使用的程序,可以比较来自不同细胞条件的数据集,识别增强子区域,然后将其分配给目标基因。

  如今,柏林马克斯·普朗克分子遗传学研究所的马丁·温格隆(Martin Vingron)领导的研究小组现已开发出一个掌握所有这些内容的程序。 “ DNA非常无聊,因为它在每个细胞中几乎都一样。如果将基因组比作生命之书,那么我对旁注则更感兴趣。”这些“旁注”是指附着在DNA分子上的小化学标记,它们不会改变遗传信息本身,但会影响相应位点上DNA发生的变化。换句话说,这些标记具有表观遗传作用。它们充当负责启动子和增强子等基因激活和失活的基因组区域的调节剂。

  在许多复杂的疾病中,基因的表观遗传控制无法正常工作,这对科学家非常感兴趣。然而,在实验室中对这些区域的分析通常是麻烦,费时且复杂的。这就是为什么Vingron和他的团队决定开发一个新的程序包的过程。

  该程序包称为条件特定的调节单元预测(CRUP),它可以简化分析并解决一些实际问题。开发该软件包的生物信息学家Verena Heinrich说:“我们希望通过一个简单的通用程序将增强子预测过程中的常见步骤结合在一起。” CRUP在许多方面简化了分析。机器学习算法不限于特定的细胞或组织类型。无需在每次分析数据集之前重新校准它,并且可以对多个数据系列进行比较研究。该工具由Heinrich和博士生Anna Ramisch开发,仍然易于使用。

  CRUP专门鉴定和表征增强子-刺激或“增强”基因转录的DNA片段。这些区域吸引附着在启动子序列上的蛋白质,该启动子序列充当每个基因的开关。然而,哪种增强子在正确的时间控制正确的基因通常仍然是一个谜。

  基因组包含成千上万个增强子,它们在细胞生命的不同阶段(如生长,维持或疾病期间)具有活性。当DNA像羊毛线一样紧密地堆积在称为组蛋白的载体蛋白线轴上时,调节序列处于“静止”状态。它们仅通过对组蛋白的化学修饰而产生影响。

  这些ChIP数据是新开发程序的初始输入值。 CRUP首先检查所有序列,然后判断它是否是增强子。分类算法基于使用小鼠胚胎干细胞的信息进行训练的人工智能产生。正如Heinrich和她的同事在德国表观基因组计划(DEEP)提供的一系列数据中所展示的那样,它可以检测许多其他动物物种或组织中的增强子区域。

图片.png

(图片来源:Www.pixabay.com)

  在第二步中,可以向CRUP导入多个数据集,程序会找到它们之间的区别。这使得可以解释一系列的测量结果或查明组织之间的差异。随着时间的流逝,或者在比较健康和患病的组织时,增强子的表观遗传变化变得显而易见。分析的第三步也是最后一步是将基因映射到它们各自的增强子。为了实现这一目标,CRUP将增强子分析与转录数据联系起来,转录数据揭示了哪些基因是活跃的,而实验则表明了DNA链的哪些部分彼此靠近。

  最后,研究人员在实际环境中测试了他们的程序。他们分析了患有免疫性类风湿关节炎的小鼠的组织,并将其与健康动物的数据进行了比较。 CRUP确定了增强子区域中的200多个差异,其中一些在其他研究中已经与该疾病相关。 CRUP分配给这些增强子的基因也已显示在疾病中起作用。

  Vingron说:“我们的程序可靠地识别出与疾病相关的增强子的候选物,并将其与靶基因联系起来。”他的团队希望该新工具将使该领域更容易使用,并加快研究速度,以帮助确定复杂的人类疾病的原因。


相关文章

我国成功培育高耐草甘膦低残留玉米

草害是制约玉米高产稳产的关键要素之一,田间杂草与玉米争夺水、肥、光和空间,且易滋生病虫害,化学除草是玉米田首选的除草方式。草甘膦是世界第一大除草剂,其灭生性的特点在防治杂草的同时对玉米也会产生药害,培......

聚焦人工智能领域,推动产业创新发展

为响应政府建设数字经济,聚焦人工智能领域,推动产业创新发展的号召,近日,由上海数据交易所、上海市数商协会举办,上海合合信息科技股份有限公司(以下简称“合合信息”)承办的“数商沙龙-走进合合信息”在上海......

2023服贸会|企业纷纷展示新技术、新服务、新成果

9月2日,召开2023年中国国际服务贸易交易会(下称“服贸会”)。近年来,新一轮科技革命和产业变革兴起,带动了数字技术强势崛起,促进了产业深度融合,引领了服务经济蓬勃发展。工业和信息化部总工程师赵志国......

我国多款自研制人工智能大模型正式面向公众开放服务

科技发展飞快,人工智能逐步研发出来。百度的文心一言、抖音的云雀大模型、中科院的紫东太初大模型等8款由中国科技企业或科研机构自主研发的人工智能大模型,8月31日宣布正式面向公众开放服务。这是中国自主研发......

数字科技,如何助力中国旅游产业转型升级?

头戴VR设备,脚踩单车,游客仿佛置身海河沿岸,可以一边骑行一边欣赏海河风光;“任意门”轻轻一拉,美丽景致“扑面而来”……正在中国天津举行的第十三届中国旅游产业博览会上,数字技术加持的文旅产业“科技范儿......

肥胖研究五大关键问题究竟如何?《科学》给出解释

北京时间9月1日晚10点,中国科学院外籍院士、中国科学院深圳先进技术研究院医药所能量代谢与生殖研究中心首席科学家JohnRogerSpeakman与丹麦哥本哈根大学公共卫生研究院的ThorkildSo......

人工智能在无人机竞速领域战胜人类冠军

《自然》8月30日发表的一篇论文报道了一个名为Swift的人工智能(AI)系统,其驾驶无人机的能力可在一对一冠军赛中战胜人类对手。该研究结果标志着移动机器人学和机器智能的一个里程碑,或可启发在其他物理......

新闻传播学一线学者聚焦生成式人工智能:如何拒绝技术依赖与专业失守

8月23日-25日,“AIGC与新闻传播学教育研讨会暨2023中国科技新闻学会数据新闻专委会培训会议”在西北民族大学召开。会议由中国科技新闻学会和西北民族大学主办,中国科技新闻学会数据新闻专委会和西北......

8人!中国人工智能学会发布最新会士增选名单

2023年度中国人工智能学会会士增选公示根据《中国人工智能学会章程》《中国人工智能学会会士评定工作办法》,学会于2023年3月启动中国人工智能学会会士候选人提名工作。经学会会士提名、会士评定工作委员会......

微电子所在28nmRRAM存内计算电路研究中获进展

物联网与人工智能技术的发展对边缘节点计算平台的实时数据处理能力与能效提出了更高要求。基于新型存储器的非易失存内计算技术可实现数据的原位存储与计算,将数据搬运带来的功耗与延迟开销最小化,从而提升边缘设备......