今年九月,对于基因组研究者们来说是一个具有纪念意义的月份,因为美国人类基因组研究院(NHGRI)资助的ENCODE项目在 Nature,Genome Biology,Genome Research等杂志上公布了三十多份论文,还有在Science,Cell,以及the Journal of Biological Chemist上的一些功能性介绍论文。这一项目的研究人员对147细胞系进行了将近1,650次实验,分子转录,转录因子结合,染色体拓扑结构,组蛋白修饰,DNA甲基化等多方面内容。
包含这些种种功能元件的就是表观遗传学,近年来科学家们越来越意识到这些元件特征在发育和疾病中的重要性,因此早在2008年,也就是NHGRI启动ENCODE计划的五年后,NIH又开始了第二项大规模图谱绘制工程:表观基因组学路线图项目(Roadmap Epigenomics Program),这一项目整理了61个“完整”的表观基因组,并且未来还计划进行更多的研究,比如8号人类表观基因组图集(Human Epigenome Atlas)。
目前这些项目的研究数据都已公开,许多研究组都在其中分子他们的目标基因,组织和兴趣途径,然而对于许多研究人员而言,要处理,分析并观察这么多数据令人恐惧。那么具体来说,我们如何进行表观遗传研究呢,有哪些工具能帮助我们呢?
No. 4 如何能获得表观基因组的全景图?
WashU浏览器中,在基因组热图的任何track上单击右键,并选择Genome Snapshot,弹出窗口结果页面就会显示人类所有23条染色体的数据集,可以放大视图了解目的基因。从这个页面上可以看到HUES6人胚胎干细胞系中的每个着丝粒周围都高度富集了组蛋白H3K9me3,就是那个顶峰值。
如果你需要寻找两种细胞类型或条件下的不同表观遗传的基因,那么可以试试NCBI表观浏览器上“Compare Samples”工具,这个工具能找到任何两个数据集中的表观遗传差异最大的基因,这是一种识别差异调控基因的好方法。例如,比较人成纤维细胞和胚胎干细胞中组蛋白H3K27me3的情况,通过这个工具,就能找到20种存在显著差别水平的基因。
No.5 如何将自己的数据与公共数据集进行比较?
假设已经完成了目的基因H3K27me3图谱,就可以将这些数据与ENCODE和Roadmap数据进行比对,美国国家环境卫生科学研究所(NIEHS)的 Lisa Chadwick表示,最简单的方法就是上传一个客户自定义track到UCSC基因组浏览器上。在浏览器主页上选择 Genome Browser,然后在搜索框中点选Add Custom Tracks。上传的数据必须格式正确,比如bigBed或BIGWIG文件格式。
而在WashU表观基因浏览器中,也支持客户track:滚动至窗口底部,选择Tracks > Custom Track,而且研究人员也可以批量上传多个track,构建data hub(数据中心)。
No.6 哪里可以获取更多信息?
Chadwick说,表观基因组项目的海量数据造成数据可视化的问题,单就数据集的体积就非常大,更别提数据本身的复杂性,“这就是为什么我们取消了所有这些不同位点和查看数据的方式,”她说,“因为没有哪种途径能解析这些庞大的数据。”
因为每一个位点都存在差异,唯一能了解其功能的途径就是把它们找出来,不过现在可以从页面上获得一些帮助,UCSC浏览器上针对ENCODE数据有视频教程(www.openhelix.com/ENCODE/),WashU也在其新一代浏览器上设置了几个视频教程(epigenomegateway.wustl.edu)。
除此之外,贝勒医学院为了更好的研究和分析表观遗传学,组织了培训班,每期40人,主要帮助学员了解表观研究工具和常见问题的解答。
虽然这些表观基因数据十分复杂,但是由于其潜在价值,因此可以说值得花费功夫去深入探究。
记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......
近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......
薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......
近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......
近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......
人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......
近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......
中外团队历时10年,在东南亚人群基因组研究领域取得里程碑式突破。北京时间14日晚,“东南亚人群基因组计划”首期成果发表在国际期刊《自然》上,东南亚人群的遗传演化之谜被揭开。论文通讯作者之一、中国科学院......
东南亚是全球最重要的人类演化区域之一。该地区人群拥有极高的遗传多样性,但基因组学研究长期缺失,制约了人类环境适应性进化与疾病遗传机制的深度解析,因而被称为全球人类基因组研究“最后一块拼图”。中国科学院......
近日,中国农业科学院郑州果树研究所(以下简称郑果所)特色浆果与干果种质改良课题组在国际期刊《植物生物技术杂志》(PlantBiotechnologyJournal)上发表研究论文,该研究组装了首个石榴......