发布时间:2012-11-07 00:00 原文链接: 表观遗传研究指南(二)

  今年九月,对于基因组研究者们来说是一个具有纪念意义的月份,因为美国人类基因组研究院(NHGRI)资助的ENCODE项目在Nature,Genome Biology,Genome Research等杂志上公布了三十多份论文,还有在Science,Cell,以及the Journal of Biological Chemist上的一些功能性介绍论文。这一项目的研究人员对147细胞系进行了将近1,650次实验,分子转录,转录因子结合,染色体拓扑结构,组蛋白修饰,DNA甲基化等多方面内容。

  包含这些种种功能元件的就是表观遗传学,近年来科学家们越来越意识到这些元件特征在发育和疾病中的重要性,因此早在2008年,也就是NHGRI启动ENCODE计划的五年后,NIH又开始了第二项大规模图谱绘制工程:表观基因组学路线图项目(Roadmap Epigenomics Program),这一项目整理了61个“完整”的表观基因组,并且未来还计划进行更多的研究,比如8号人类表观基因组图集(Human Epigenome Atlas)。

  目前这些项目的研究数据都已公开,许多研究组都在其中分子他们的目标基因,组织和兴趣途径,然而对于许多研究人员而言,要处理,分析并观察这么多数据令人恐惧。那么具体来说,我们如何进行表观遗传研究呢,有哪些工具能帮助我们呢?

  No.2 哪里找寻数据?

  ENCODE项目数据地址为encodeproject.org,也可以在美国加州大学圣克鲁斯分校(UCSC)基因组浏览器(genome.ucsc.edu)上通过选择区域中激活ENCODE数据tracks来看到这些数据。

  研究人员还可以从美国生物技术信息中心NCBI Gene Expression Omnibus (www.ncbi.nlm.nih.gov/geo/roadmap/epigenomics)上查看和/或下载Roadmap Epigenome 数据,同样UCSC基因组浏览器,或其他几个更快的UCSC mirrors (比如www.epigenomebrowser.org))上寻找数据。

  其它路线图查看网站还包括托管在贝勒医学院的人类表观基因图谱(www.genboree.org/ epigenomeatlas),Roadmap Epigenomics Data Browser (www.roadmapepigenomics.org/data),以及NCBI表观基因组浏览器(www.ncbi.nlm.nih.gov /epigenomics)。

  除此之外,华盛顿大学圣路易斯分校还有一些完全不同的数据――“新一代”浏览器www.ncbi.nlm.nih.gov/epigenomics (Nat Meth, 8:989-90, 2011)。这个WashU 表观基因浏览器能帮助用户获得与UCSC浏览器标准基因组为中心的视图以外的数据,比如说,同时了解某个途径中所有基因(或启动子,或3‘UTRs)。 “你可以进行多项类似谷歌地图样式的操作,从而能在这种相关的元数据中分析你的数据“,华盛顿大学医学院的遗传学家王婷(Ting Wang,音译)说。

  No.3 如何寻找目的基因的表观基因修饰

  所有的基因组和表观基因组浏览器都能看到特殊基因组位置,UCSC浏览器用户能通过页面顶端的一个搜索窗口,定位某种基因(比如说BRCA1)或者基因组位点。之后这些数据就会根据信号强弱,或者基因组位置图表形式显示出来,并像所有UCSC浏览器tracks一样,可以打开或关闭,向上或向下移动以简化视图。

  而对于WashU表观基因浏览器,在选择了目的基因组之后(譬如人,小鼠,果蝇等),用户能通过点击浏览器上浮动窗口中的Apps > Relocation,查看特殊的基因组位置。如果要同时查看某个途径中的所有基因,那么可以滚动浏览器页面底部的垂直菜单,选择Genomic View > Gene Set View > KEGG Pathways (或者如果要找不相干的基因,就可以点击Custom Gene Set)。例如,点击“path:hsa03420”核苷酸切除修复途径,获得的结果会同时显示68个来自此途径的基因,即使它们位于不同染色体上。

  这种特殊的浏览器视图具有高度可配置性:可以在基因组heatmap个体数据轨道tracks上单击鼠标右键,改变每一行的外观;或者根据元数据排序,如表观遗传标记或细胞类型,通过点击在浏览器右侧的元数据heatmap就能实现这一点。这种浏览器还增加了一个有用的“远程互动轨道(long- range interaction tracks)”的功能,从而用户可以利用5C,HiCkory和ChIAPET这样的技术来查看ENCODE项目中染色质相互作用数据,这些显示在基因组tracks下方的“arcs”,能指出虽然距离远,但物理位置接近的染色体区域。

  “目前已有不少技术能用于分析染色质相互作用了……但却没有好方法来查看线性基因组浏览器中的(这些相互作用),“Wang解释道。

  如果你这是感兴趣于独立的某些基因的表观遗传学状态,那么也可以不通过基因组浏览器来查看――在人类表观基因图谱Human Epigenome Atlas 主页上,有链接可以进入data matrix 页面,之后选择对应于兴趣基因的数据集框,从乳腺腔上皮细胞,乳腺肌上皮细胞,与乳腺癌干细胞中选出六个MeDIP-Seq和MRE-Seq数据集(甲基化,或无甲基化)。在页面顶端,单击Selections > View In > Atlas Gene Browser。

  然后在出现的页面中,在基因搜索框里键入BRCA1在基因搜索框,页面将会显示基因23个外显子,内含子,和启动子的平均甲基化强度条形图。而且还可以点击 Add Gene ,选择另外的基因(例如BRCA2),或点击Pathway Browser,添加同一途径的其它基因。

相关文章

一种单细胞藻类细胞中有7个基因组

一种50多年前收集并在实验室中生长的单细胞藻类,原来是一个由曾经独立的生物组成的奇怪的集合体,里面有不少于7个不同的基因组。4月27日,相关成果发表于《当代生物学》。“据我所知,单个细胞中有7个不同的......

解码基因组“暗物质”,拓宽生命认知疆域

人类约有2万个基因,仅占DNA的2%,剩下的98%是什么?这些区域如同基因组中的“暗物质”,有待科学家去发现。非编码RNA(核糖核酸)是基因组“暗物质”中的一类重要分子,最近十几年才被发现。它们不仅在......

世界上最快的生物运动背后的巨大蛋白

科学家们发现了Spirostomum的超快收缩的分子基础,Spirostomum是一种以令人难以置信的快速运动而闻名的毫米级单细胞原生动物属。利用从RNAi获得的高质量基因组,研究人员发现收缩结构,即......

2023年,基因组学革命“狂飙”到了哪一步?

2023年4月25日是DNA双螺旋结构发现70周年纪念日。70年前科学家的这一发现,将生物学研究带入分子时代。携带着生命遗传信息的DNA,以如是美妙的姿态,于纳米级的空间内,传递着生物世界变化万端、生......

“千人藏族基因组”重新评估藏人高原适应性特征

中国科学院昆明动物所研究员宿兵团队与西藏大学、西藏阜康医院等单位研究团队合作,利用大规模WGS(全基因组测序)数据,构建了首个藏族人群基因组参考面板(1000Tibetan-GenomePanel,1......

自然:二倍体蚕豆基因组解开全球蛋白质作物的变异之谜

丹麦奥胡斯大学StigUggerhøjAndersen等研究人员的最新发现表明,巨大的二倍体蚕豆基因组解开全球蛋白质作物的变异之谜。2023年3月8日,《自然》杂志在线发表了这项成果。研究人员介绍,在......

AI揭示影响人脑发育基因组突变

科技日报北京2月21日电美国研究人员使用人工智能(AI)模型揭示了可能影响人类认知进化的基因组突变。这项人类基因组学的开创性研究可能会促进发现复杂脑部疾病的新疗法。该研究发表在新一期的《科学进展》上。......

染色体水平冬瓜参考基因组发布

近日,广东省农业科学院蔬菜研究所发布了染色体水平冬瓜参考基因组。相关研究发表于ScientificData,广东省农业科学院蔬菜研究所副研究员罗文龙和副研究员闫晋强为该论文共同第一作者,广东省农业科学......

首个家鸡基因组图谱绘制完成

西南大学教授徐洛浩课题组以中国特有家鸡品系胡须鸡为材料,在国际上率先绘制出首个家鸡全基因组图谱。2月13日,相关研究成果以《家鸡基因组完成图的演化分析》为题,发表在美国《国家科学院院刊》上。这是继去年......

首个家鸡基因组图谱绘制完成

西南大学教授徐洛浩课题组以中国特有家鸡品系胡须鸡为材料,在国际上率先绘制出首个家鸡全基因组图谱。2月13日,相关研究成果以《家鸡基因组完成图的演化分析》为题,发表在美国《国家科学院院刊》上。这是继去年......