发布时间:2012-11-05 00:00 原文链接: 表观基因组学研究指南(一)

  今年九月,对于基因组研究者们来说是一个具有纪念意义的月份,因为美国人类基因组研究院(NHGRI)资助的ENCODE项目在Nature,Genome Biology,Genome Research等杂志上公布了三十多份论文,还有在Science,Cell,以及the Journal of Biological Chemist上的一些功能性介绍论文。这一项目的研究人员对147细胞系进行了将近1,650次实验,分子转录,转录因子结合,染色体拓扑结构,组蛋白修饰,DNA甲基化等多方面内容。

  包含这些种种功能元件的就是表观遗传学,近年来科学家们越来越意识到这些元件特征在发育和疾病中的重要性,因此早在2008年,也就是NHGRI启动ENCODE计划的五年后,NIH又开始了第二项大规模图谱绘制工程:表观基因组学路线图项目(Roadmap Epigenomics Program),这一项目整理了61个“完整”的表观基因组,并且未来还计划进行更多的研究,比如8号人类表观基因组图集(Human Epigenome Atlas)。

  目前已有一些研究人员参与到这些研究中,比如华盛顿大学的John Stamatoyannopoulos研究组就分析了DNaseI高敏感位点(DNaseI Hypersensitive Sites,DHSs)在多种人类细胞株全基因组的分布图谱及特征、DHSs与基因调控序列(主要是启动子与增强子)的关系、DHSs与转录因子基因组定位的关系及其在基因转录表达调控中的作用,以及揭示与疾病相关的非编码序列遗传变异的生物功能等。

  今年9月,这一研究组通过分析人类349种细胞和组织样本的全基因组DNase I图谱与已有的GWAS SNPs数据,发现约93%的与疾病和性状相关的SNPs位于非编码序列内,并且集中在DNase I高敏感位点区域(DHSs)。88%含有SNP的DHSs存在于胎儿发育阶段,并且在这些DHSs内的SNPs与妊娠暴露相关表型 (gestational exposure-related phenotypes)有关。此外,与含有SNP的DHS密切相关的远距离靶基因(绝大多数基因距离该DHSs超过100 kb)行使的功能与同一SNP相关的疾病表型相类似,这一联系拓展了在基因组水平疾病与性状之间的关联性,同时提供了一个潜在的致病基因库来解释这种关联性。93.2%DHSs内部的疾病相关SNPs同时位于转录因子识别序列内,并影响了局部的染色质结构。这些转录因子进一步形成复杂的网络系统,调控与疾病相关的基因表达。

  目前这些项目的研究数据都已公开,许多研究组都在其中分子他们的目标基因,组织和兴趣途径,然而对于许多研究人员而言,要处理,分析并观察这么多数据令人恐惧。来自NIH Roadmap Epigenomics Program的一位研究人员:John Satterlee提出了建议―― jump in and see what’s there,“这并不是像在浪费试剂,而是像在硅片实验室中进行实验”,他说。

  那么具体来说,我们如何进行表观遗传研究呢,有哪些工具能帮助我们呢?

  No.1 哪里找寻数据?

  ENCODE和NIH Roadmap Epigenomics 项目都能提供一些数据,从而研究人员能根据细胞或组织分类,或表观遗传标记来浏览这些数据,“至少能在三个方面进行选择”,来自贝勒医学院的一位遗传学家 Aleksandar Milosavljevic解释道,“研究人员可以选择相同的类型,检测和基因组内涵”。

  举个例子来说,假如感兴趣的是H1人类胚胎干细胞。在ENCODE项目主页上,从页面左侧的导航栏上选择“Experiment Matrix”,结果页面会显示出,针对H1人类胚胎干细胞有124个数据集,包括10 个RNA-seq和91 个ChIP-seq 分析数据集。单击任何一个小方块,就能看到这些数据。

  同时在人类表观基因图集和Roadmap Epigenomics Data浏览器中也能看到Roadmap Epigenomics数据,利用两个网页上的Search窗口,能筛选组织类型,并且研究人员还可以通过Roadmap Epigenomics Data浏览器顶端的Visual Data Browser 上的三个选项:Embryonic Stem Cells,Fetal Tissues,或Adult Cells & Tissues,筛选组织类型。这个项目收集了106个 H1胚胎干细胞的数据集,从而研究人员就能寻找其目标基因了。

相关文章

因美纳推出5碱基解决方案以驱动多组学发现,开启基因组与表观基因组的同步洞察

• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......

许瑞明研究组合作揭示人逆转座子LINE1靶向整合基因组的重要机制

人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

这个因子助水稻“粒粒归仓”

水稻落粒性直接影响收获产量,精准调控落粒性是实现"粒粒归仓"的关键。发掘落粒性关键基因,为培育适合落粒性水稻品种,提供强有力的工具。与此同时,伴随生活水平的提高,消费者越来越青睐具......

研究发现调控杨树生长发育及耐盐性的转录因子

近日,山西农业大学林学院林木分子遗传育种创新工作室在《经济作物和产品》(IndustrialCropsandProducts)接连发表了两项研究成果。研究发现,热休克因子PagHSF4和乙烯响应因子E......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

基因组大数据还原野猪横跨欧亚的百万年迁徙历程

近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......