来自杜克大学的研究人员创造了第一张人类基因组印记基因(imprinted genes)图谱,并且他们表示其成功的关键在于一个称为机器学习(machine learning)的人工智能形式:dern-day Rosetta stone。这项研究新发现了四倍于之前识别的印记基因,并即将公布在12月3日《基因组研究》(Genome Research)封面上。
印记基因是指存在亲本染色体上的等位基因的表达取决于它们是在父源染色体上还是在母源染色体上,来自父系、母系的印记基因有所不同,当精卵结合时,父母双方印记基因均应出现,否则发育就不正常。这种基因印记是等位基因依赖双亲性别表达的不符合孟德尔遗传定律的特殊遗传现象,基因印记异常调节可引起一些遗传性疾病。
在传统的遗传学中,子女会继承一个基因的两个拷贝,一个来自于父本,一个来自于母本,这两个拷贝的活性形式会影响子女的发育。但是当印记基因出现——这两个拷贝中一个会被来自母本或父本的分子调控关闭,这也就意味着子女只会继承基因的一个拷贝的信息,这样的子女易受到环境压力的影响:如果一个功能拷贝受到损伤或遗失,那么就没有顶替的后备了。
杜克大学放射肿瘤学及病理学系的遗传学家Randy Jirtle博士表示,“基因印记一直以来都是一个谜,这部分是由于它们并不遵循传统的遗传规律”,“我们希望这一新发现的roadmap能帮助我们和其他研究人员发现更多有关这些基因如何影响我们的健康的信息。”
在文章的其他作者Alexander Hartemink,Philippe Luedi的合作下,Jirtle他们将两类基因——一类是已知的印记基因,一类不是——的序列数据输入到计算机中,利用程序帮助发现其中的差别,通过这一机器分析的方法获得了一个运算法则:能像最原始的Rosetta stone解码看上去费解的数据,在这里指的是指向印记基因的特异性DNA序列。
Hartemink表示,“我们不能完全肯定的说我们识别了所有印记基因,但是我们认为这是其中的大部分。”
Jirtle研究印记已经多年了,他表示印记事件是一个表观遗传事件,这也就是说不需要改变DNA的序列就可以改变基因的功能,“印记基因容易受到环境的攻击——甚至是我们的饮食和呼吸。而且重要的是,表观遗传变化是可以遗传,我想人们还没有意识到这一点。”
预计印记基因占人类基因组的1%,并且至今只发现了一部分,利用这一研究中的新“Rosetta stone”方法,Jirtel和Hartemink发现了156个新的印记基因,其中两个特殊基因定位在8号染色体上,这在之前是没有发现过的,其中一个基因KCNK9,在大脑中十分活跃,已知是引起癌症,和双相障碍(bipolar disorder),癫痫的原因之一,而第二个基因DLGAP2是一个可能的膀胱癌肿瘤抑制因子。(来源:生物通)
(《基因组研究》(Genome Research),10.1101/gr.6584707,Philippe P. Luedi,Randy L. Jirtle)
相关阅读(英文)
• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......
人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......
橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......
记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......
近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......
薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......
近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......
近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......
人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......
近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......