近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(NGDC)开发的表观基因组关联研究资源开放平台EWAS Open Platform上线。相关研究成果以EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study为题在Nucleic Acids Research上在线发表。
随着表观基因组关联研究(EWAS)的爆炸式增长,出现了大量EWAS学术论文,积累了海量EWAS相关数据。对这些数据进行标准化整合,并从已发表论文中提取和挖掘表观关联知识,对于系统的表征和研究不同实验条件下的甲基化状态、探索与各种性状相关的表观遗传分子机制具有重要意义。NGDC在2019年和2020年先后开发了基于高质量的人工审编EWAS知识库(EWAS Atlas)和存储了海量标准化DNA甲基化芯片数据的EWAS数据库(EWAS Data Hub)。
为了提供从数据浏览与下载、在线分析与可视化到知识解释与验证的全面系统的资源和服务,NGDC研究团队在不断整合和更新中心已有EWAS资源基础上,构建了表观组关联研究资源开放平台(EWAS Open Platform)。EWAS Open Platform包括标准化的数据信息库 (EWAS Data Hub)、人工信息提取的知识库(EWAS Atlas)和表观-特征关联在线工具(EWAS Toolkit) 三部分。EWAS Data Hub整合了115852个样本的DNA甲基化芯片数据和对应的元数据,并统一采用GMQN方法进行标准化。同时,EWAS Data Hub利用海量高质量DNA甲基化芯片数据和标准化元数据的优势,为485512个探针和36397个基因提供了一系列重要的评估值(包括组织特异性、年龄相关性、性别差异和种族特异性)和不同背景下的参考DNA甲基化图谱;EWAS Atlas共整合了910篇文献中报道的617018个高质量的甲基化与表型关联,涉及618种表型和3385个队列;EWAS Toolkit利用EWAS Atlas和EWAS Data Hub提供的高质量的甲基化与表型关联知识和标准化的DNA甲基化芯片数据,为用户提供多种在线分析和可视化工具,包括富集分析、注释、知识图谱可视化等。
该研究得到了中科院战略性先导科技专项、国家重点研发计划、中科院关键技术人才等项目资助。
一项发表在最新一期《自然》杂志上的研究,通过对生活在10200至150年前的南非个体基因组进行分析,证实了在南部非洲,一群智人在半隔离的状态下生活了数十万年。这是迄今规模最大的对非洲古代DNA的研究,......
• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......
人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......
橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......
记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......
近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......
薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......
近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......
近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......
人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......