发布时间:2012-11-17 00:00 原文链接: 表观基因组学研究指南(三)

  今年九月,对于基因组研究者们来说是一个具有纪念意义的月份,因为美国人类基因组研究院(NHGRI)资助的ENCODE项目在 Nature,Genome Biology,Genome Research等杂志上公布了三十多份论文,还有在Science,Cell,以及the Journal of Biological Chemist上的一些功能性介绍论文。这一项目的研究人员对147细胞系进行了将近1,650次实验,分子转录,转录因子结合,染色体拓扑结构,组蛋白修饰,DNA甲基化等多方面内容。

  包含这些种种功能元件的就是表观遗传学,近年来科学家们越来越意识到这些元件特征在发育和疾病中的重要性,因此早在2008年,也就是NHGRI启动ENCODE计划的五年后,NIH又开始了第二项大规模图谱绘制工程:表观基因组学路线图项目(Roadmap Epigenomics Program),这一项目整理了61个“完整”的表观基因组,并且未来还计划进行更多的研究,比如8号人类表观基因组图集(Human Epigenome Atlas)。

  目前这些项目的研究数据都已公开,许多研究组都在其中分子他们的目标基因,组织和兴趣途径,然而对于许多研究人员而言,要处理,分析并观察这么多数据令人恐惧。那么具体来说,我们如何进行表观遗传研究呢,有哪些工具能帮助我们呢?

  No. 4 如何能获得表观基因组的全景图?

  WashU浏览器中,在基因组热图的任何track上单击右键,并选择Genome Snapshot,弹出窗口结果页面就会显示人类所有23条染色体的数据集,可以放大视图了解目的基因。从这个页面上可以看到HUES6人胚胎干细胞系中的每个着丝粒周围都高度富集了组蛋白H3K9me3,就是那个顶峰值。

  如果你需要寻找两种细胞类型或条件下的不同表观遗传的基因,那么可以试试NCBI表观浏览器上“Compare Samples”工具,这个工具能找到任何两个数据集中的表观遗传差异最大的基因,这是一种识别差异调控基因的好方法。例如,比较人成纤维细胞和胚胎干细胞中组蛋白H3K27me3的情况,通过这个工具,就能找到20种存在显著差别水平的基因。

  No.5 如何将自己的数据与公共数据集进行比较?

  假设已经完成了目的基因H3K27me3图谱,就可以将这些数据与ENCODE和Roadmap数据进行比对,美国国家环境卫生科学研究所(NIEHS)的 Lisa Chadwick表示,最简单的方法就是上传一个客户自定义track到UCSC基因组浏览器上。在浏览器主页上选择 Genome Browser,然后在搜索框中点选Add Custom Tracks。上传的数据必须格式正确,比如bigBed或BIGWIG文件格式。

  而在WashU表观基因浏览器中,也支持客户track:滚动至窗口底部,选择Tracks > Custom Track,而且研究人员也可以批量上传多个track,构建data hub(数据中心)。

  No.6 哪里可以获取更多信息?

  Chadwick说,表观基因组项目的海量数据造成数据可视化的问题,单就数据集的体积就非常大,更别提数据本身的复杂性,“这就是为什么我们取消了所有这些不同位点和查看数据的方式,”她说,“因为没有哪种途径能解析这些庞大的数据。”

  因为每一个位点都存在差异,唯一能了解其功能的途径就是把它们找出来,不过现在可以从页面上获得一些帮助,UCSC浏览器上针对ENCODE数据有视频教程(www.openhelix.com/ENCODE/),WashU也在其新一代浏览器上设置了几个视频教程(epigenomegateway.wustl.edu)。

  除此之外,贝勒医学院为了更好的研究和分析表观遗传学,组织了培训班,每期40人,主要帮助学员了解表观研究工具和常见问题的解答。

  虽然这些表观基因数据十分复杂,但是由于其潜在价值,因此可以说值得花费功夫去深入探究。

相关文章

“女娲”基因组计划发布第五项成果

近日,“女娲”基因组团队重点阐释了适应性选择下非编码调控元件对表型演化的影响,相关研究发表于《分子生物学与进化》。这项工作是中国科学院生物物理研究所徐涛院士、何顺民研究员牵头的“女娲”(NyuWa)中......

一生中患病的几率或可预测,十种慢性病遗传风险估算更接近临床

通过分析基因组中数百万个微小的遗传差异,就可预测一个人一生中患某种疾病的几率。在过去的10年中,研究人员为数十种疾病制定了风险评分,希望有一天患者能利用这些信息来降低患病风险。在《自然·医学》杂志最新......

揭秘基因组“暗物质”

记国家自然科学基金重大研究计划“基因信息传递过程中非编码RNA的调控作用机制”在人类遗传信息传递过程中,非编码RNA不参与编码蛋白质,占全部RNA的98%,如同宇宙中神秘的“暗物质”,是生命活动调控的......

构建水稻基因组倒位变异图谱

近日,中国农业科学院深圳农业基因组研究所联合国内多家单位发布了迄今为止最大的水稻群体水平倒位变异图谱,并挖掘获得了新的水稻耐热优异等位基因,该研究对水稻育种改良具有重要意义。相关研究成果发表在《科学通......

基因组精确注释新方法:增强子鉴定新技术

近日,中国农业科学院深圳农业基因组研究所动物功能基因组学创新团队研发出增强子鉴定新技术。该技术与传统技术相比,平均分辨率提高了约10倍,为基因组的精确注释提供了新方法。相关研究成果发表在《核酸研究》(......

迈向CRISPR2.0,下一代基因编辑技术方兴未艾

美国食品药品监督管理局(FDA)本月稍早时间宣布,批准CRISPR/Cas9基因编辑疗法Casgevy上市,用于治疗12岁及以上镰状细胞贫血病患者。这是FDA批准的首款CRISPR基因编辑疗法。而11......

瑞孚迪:改变千万新生命——全基因组测序在新生儿筛查中的应用

导读:这项技术可以及早发现那些可能对患儿生命产生重大影响的罕见疾病。     瑞孚迪的这项首创研究证明了全基因组测序在对看似健康的新生儿的筛查中存在重......

科学家解析百余“神奇蘑菇”基因组以培育新品种

科学家收集了几十种“神奇蘑菇”的基因组数据,以了解驯化和培养是如何改变它们的,从而培育新品种蘑菇。相关研究近日发表于《当代生物学》。裸盖菇的商业品种缺乏遗传多样性,因为它们被驯化为人类使用。而澳大利亚......

万种原生生物基因组计划取得阶段性进展

原生生物(Protist)是一大类单细胞真核生物的集合,包括单细胞真核藻类和原生动物等,组成了原生生物界。原生生物具有高度多样性,广泛分布于各类水环境中,在生态平衡、物质和能量循环、环境健康、动植物疾......

俄罗斯科学家参与创建基因组数据统一平台

来自俄罗斯、美国、土耳其和欧洲的科学家开发了一个Shambhala平台,可将大量基因活性水平的大数据结合起来。该数据库的创建将使科学家能够将不同实验中兼容性较差的数据结合起来。此项成果发表于《分子生物......