发布时间:2016-12-05 13:34 原文链接: 北京基因组所生命组学数据资源建设获进展

  近日,中国科学院北京基因组研究所生命与健康大数据中心团队题为The BIG Data Center: from deposition to integration to translation 的研究论文被国际学术期刊《核酸研究》(Nucleic Acids Research)在线发表。该研究成果的发表是国内首次以数据中心为模式,整体发布我国生命组学数据资源建设情况,标志着生命与健康大数据中心建设取得实质性重要进展,也标志着我国建设综合性基因组数据资源获得国际同行认可。

  生命与健康大数据中心建成面向国家大数据发展战略的多层次生物组学数据资源系统,包括基于高通量测序的原始组学数据归档库(Genome Sequence Archive,GSA),围绕国家重要战略生物资源的基因组数据库(Genome Warehouse,GWH)、基于测序数据的基因表达数据库(Gene Expression Nebulas,GEN)、基于中国人群以及国家重要物种群体的基因组变异数据库(Genome Variation Map,GVM)、基于全基因组DNA甲基化图谱的表观基因组数据库(Methylation Bank,MethBank)以及基于大众审编(Community Curation)的生命科学维基知识库(Science Wikis),初步形成我国生命与健康数据汇交与共享平台,具备可服务于全球的基因组数据共享网络。

  国际三大数据中心(NCBI、EBI、DDBJ)对全球生物数据长期占据着主导地位,北京基因组所生命与健康大数据中心(BIG Data Center),作为北京基因组所的重要研究单元,承担相关公共数据库资源体系的研究与建设,面向我国人口健康和社会可持续发展的重大战略需求,围绕国家精准医学和重要战略生物资源的组学数据,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台。

  生命与健康大数据中心研究员章张、高级工程师赵文明以及研究员肖景发为该文共同通讯作者。该研究得到中科院战略性先导科技专项、中科院国际大科学计划、国家“863”项目、国家“973”项目、国家自然基金项目、中科院百人计划等项目基金的资助。

大数据中心建设

相关文章

因美纳推出5碱基解决方案以驱动多组学发现,开启基因组与表观基因组的同步洞察

• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......

许瑞明研究组合作揭示人逆转座子LINE1靶向整合基因组的重要机制

人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

基因组大数据还原野猪横跨欧亚的百万年迁徙历程

近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......

基因组密码被解锁:深度学习模型破解非编码区奥秘

人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......

专家解读|深化数据资源开发利用促进数据资源价值释放

近期,在第八届数字中国建设峰会上,《全国数据资源调查报告(2024年)》(以下简称“报告”)正式发布。调查显示,我国数据开发利用更加活跃,创新引擎作用更加凸显。2024年,我国公共数据开放程度逐渐提升......