今年九月,对于基因组研究者们来说是一个具有纪念意义的月份,因为美国人类基因组研究院(NHGRI)资助的ENCODE项目在Nature,Genome Biology,Genome Research等杂志上公布了三十多份论文,还有在Science,Cell,以及the Journal of Biological Chemist上的一些功能性介绍论文。这一项目的研究人员对147细胞系进行了将近1,650次实验,分子转录,转录因子结合,染色体拓扑结构,组蛋白修饰,DNA甲基化等多方面内容。
包含这些种种功能元件的就是表观遗传学,近年来科学家们越来越意识到这些元件特征在发育和疾病中的重要性,因此早在2008年,也就是NHGRI启动ENCODE计划的五年后,NIH又开始了第二项大规模图谱绘制工程:表观基因组学路线图项目(Roadmap Epigenomics Program),这一项目整理了61个“完整”的表观基因组,并且未来还计划进行更多的研究,比如8号人类表观基因组图集(Human Epigenome Atlas)。
目前这些项目的研究数据都已公开,许多研究组都在其中分子他们的目标基因,组织和兴趣途径,然而对于许多研究人员而言,要处理,分析并观察这么多数据令人恐惧。那么具体来说,我们如何进行表观遗传研究呢,有哪些工具能帮助我们呢?
No.2 哪里找寻数据?
ENCODE项目数据地址为encodeproject.org,也可以在美国加州大学圣克鲁斯分校(UCSC)基因组浏览器(genome.ucsc.edu)上通过选择区域中激活ENCODE数据tracks来看到这些数据。
研究人员还可以从美国生物技术信息中心NCBI Gene Expression Omnibus (www.ncbi.nlm.nih.gov/geo/roadmap/epigenomics)上查看和/或下载Roadmap Epigenome 数据,同样UCSC基因组浏览器,或其他几个更快的UCSC mirrors (比如www.epigenomebrowser.org))上寻找数据。
其它路线图查看网站还包括托管在贝勒医学院的人类表观基因图谱(www.genboree.org/ epigenomeatlas),Roadmap Epigenomics Data Browser (www.roadmapepigenomics.org/data),以及NCBI表观基因组浏览器(www.ncbi.nlm.nih.gov /epigenomics)。
除此之外,华盛顿大学圣路易斯分校还有一些完全不同的数据――“新一代”浏览器www.ncbi.nlm.nih.gov/epigenomics (Nat Meth, 8:989-90, 2011)。这个WashU 表观基因浏览器能帮助用户获得与UCSC浏览器标准基因组为中心的视图以外的数据,比如说,同时了解某个途径中所有基因(或启动子,或3‘UTRs)。 “你可以进行多项类似谷歌地图样式的操作,从而能在这种相关的元数据中分析你的数据“,华盛顿大学医学院的遗传学家王婷(Ting Wang,音译)说。
No.3 如何寻找目的基因的表观基因修饰
所有的基因组和表观基因组浏览器都能看到特殊基因组位置,UCSC浏览器用户能通过页面顶端的一个搜索窗口,定位某种基因(比如说BRCA1)或者基因组位点。之后这些数据就会根据信号强弱,或者基因组位置图表形式显示出来,并像所有UCSC浏览器tracks一样,可以打开或关闭,向上或向下移动以简化视图。
而对于WashU表观基因浏览器,在选择了目的基因组之后(譬如人,小鼠,果蝇等),用户能通过点击浏览器上浮动窗口中的Apps > Relocation,查看特殊的基因组位置。如果要同时查看某个途径中的所有基因,那么可以滚动浏览器页面底部的垂直菜单,选择Genomic View > Gene Set View > KEGG Pathways (或者如果要找不相干的基因,就可以点击Custom Gene Set)。例如,点击“path:hsa03420”核苷酸切除修复途径,获得的结果会同时显示68个来自此途径的基因,即使它们位于不同染色体上。
这种特殊的浏览器视图具有高度可配置性:可以在基因组heatmap个体数据轨道tracks上单击鼠标右键,改变每一行的外观;或者根据元数据排序,如表观遗传标记或细胞类型,通过点击在浏览器右侧的元数据heatmap就能实现这一点。这种浏览器还增加了一个有用的“远程互动轨道(long- range interaction tracks)”的功能,从而用户可以利用5C,HiCkory和ChIAPET这样的技术来查看ENCODE项目中染色质相互作用数据,这些显示在基因组tracks下方的“arcs”,能指出虽然距离远,但物理位置接近的染色体区域。
“目前已有不少技术能用于分析染色质相互作用了……但却没有好方法来查看线性基因组浏览器中的(这些相互作用),“Wang解释道。
如果你这是感兴趣于独立的某些基因的表观遗传学状态,那么也可以不通过基因组浏览器来查看――在人类表观基因图谱Human Epigenome Atlas 主页上,有链接可以进入data matrix 页面,之后选择对应于兴趣基因的数据集框,从乳腺腔上皮细胞,乳腺肌上皮细胞,与乳腺癌干细胞中选出六个MeDIP-Seq和MRE-Seq数据集(甲基化,或无甲基化)。在页面顶端,单击Selections > View In > Atlas Gene Browser。
然后在出现的页面中,在基因搜索框里键入BRCA1在基因搜索框,页面将会显示基因23个外显子,内含子,和启动子的平均甲基化强度条形图。而且还可以点击 Add Gene ,选择另外的基因(例如BRCA2),或点击Pathway Browser,添加同一途径的其它基因。
人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......
在生命的微观世界里,细胞分裂时有着严格的染色体分配原则。按照经典遗传学和细胞生物学理论,细胞有丝分裂或减数分裂后,每个子细胞核都应该至少获得完整的一套单倍体染色体,这样才能保证细胞正常发育和发挥功能。......
近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......
中外团队历时10年,在东南亚人群基因组研究领域取得里程碑式突破。北京时间14日晚,“东南亚人群基因组计划”首期成果发表在国际期刊《自然》上,东南亚人群的遗传演化之谜被揭开。论文通讯作者之一、中国科学院......
东南亚是全球最重要的人类演化区域之一。该地区人群拥有极高的遗传多样性,但基因组学研究长期缺失,制约了人类环境适应性进化与疾病遗传机制的深度解析,因而被称为全球人类基因组研究“最后一块拼图”。中国科学院......
近日,中国农业科学院郑州果树研究所(以下简称郑果所)特色浆果与干果种质改良课题组在国际期刊《植物生物技术杂志》(PlantBiotechnologyJournal)上发表研究论文,该研究组装了首个石榴......
中国农业大学教授韩振海团队基于30份苹果属植物高质量基因组,系统解析了苹果属数千万年的演化历程,并构建了首个苹果属图形泛基因组,发布了苹果属遗传多样性全景图。日前,相关研究成果发表于《自然-遗传学》。......
假根羽藻(Bryopsiscorticulans)是在北温带海洋潮间带广泛分布的大型绿藻。假根羽藻生存需适应不断变化的潮汐、温度和紫外线辐射等环境因素。涨潮时,假根羽藻的光合蛋白可在蓝绿光和绿光为主的......
近日,中国农业科学院郑州果树研究所猕猴桃资源与育种创新团队组装构建了首个全红型四倍体软枣猕猴桃参考基因组近完成图,利用该图鉴定了新的色泽调控模块,为猕猴桃色泽改良奠定基础。相关研究成果发表在《分子园艺......
在传统医学的宝库中,天冬(Asparaguscochinchinensis)作为一味重要的中药材,其加工后的块根——天门冬,在东亚地区尤其是中国,有着悠久的药用历史。它不仅能治疗多种疾病,如胃痛、便秘......