发布时间:2017-02-13 10:27 原文链接: 中国BIGD跻身国际生物组学数据库

  测序技术的发展将生命科学领域带入组学时代,海量的数据产出成为常态。组学是将基因、蛋白及代谢物等生物分子以整体为单位进行系统性的研究,基因组学、蛋白质组学和代谢物组学等相应产生。相较于此前以个体为单位的研究,组学最主要的特征就是大数据。随着组学数据的产出,搭建组学数据库,实现海量信息的存储、整合及共享,成为一项重要任务。

  目前,在国际上被认可的生物组学数据中心主要有美国的NCBI、欧洲的EBI及日本的DDBJ。要想在国际期刊发表论文,需要先将自己的原始数据提交到这三个官方指定的数据库中。这种情况表面上有利于国际科学数据的资源整合与共享,实际上却对中国的科学研究发展带来了很大的影响:这不仅影响了数据提交时的效率,更重要的是在数据下载时还会遇到各种限制,中国的科学家始终不能做自己数据的主人。

  中国的生物组学数据产量约占全球的40%,是数据产出大国,却没有一个能够被国际认可的数据库系统,不得不将自己宝贵的数据资源交给他人代管。

  现在,这种情况终于得到改变。近日,中国科学院北京基因组研究所生命与健康大数据中心团队在国际学术期刊《核酸研究》在线发表了一篇研究论文,题目为“北京基因组研究所生命与健康大数据中心:从存储到整合再到转化”。生命与健康大数据中心章张研究员、赵文明高级工程师以及肖景发研究员为本文共同通讯作者。这是我国第一次以数据中心的模式,整体发布我国生命组学数据资源的建设情况,标志着生命与健康大数据中心的建设取得了实质性进展,也标志着我国建设综合性基因组数据资源获得国际同行认可。

  北京基因组研究所生命与健康大数据中心(Beijing Institute of Genomics Data Center)简称BIGD,肩负着建成面向国家大数据发展战略的多层次生物组学数据资源系统的重要历史使命。目前的数据资源系统包括:高通量测序的原始组学数据归档库GSA,围绕国家重要战略生物资源的基因组数据库GWH,基于测序数据的基因表达数据库GEN,基于中国人群以及国家重要物种群体的基因组变异数据库GVM,基于全基因组DNA甲基化图谱的表观基因组数据库MethBank,以及基于大众审编的生命科学维基知识库Science Wikis等,初步形成了我国生命与健康数据交会与共享平台,具备可服务于全球的基因组数据共享网络。该研究得到中国科学院战略性先导科技专项、中国科学院国际大科学计划等项目基金的资助。

  现在,包括美国国家科学院院刊、细胞研究等核心期刊在内的多个国际核心期刊已经认可把数据提交到BIGD,中国原始组学数据库BIGD成为继国际三大数据中心之后,国际上第四个被认可的数据库。

相关文章

岛津又一合作成果——GCMS特色代谢物数据库正式发布

代谢组学(Metabonomics/Metabolomics)是继基因组学和蛋白质组学之后新近发展起来的一门学科,是系统生物学的重要组成部分,已广泛应用于食品及医药等领域。岛津一直致力于为代谢组学研究......

关于印发《数据库政府采购需求标准(2023年版)》的通知

财库〔2023〕35号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主党派中央,有关人民团体,各省、自治区、直辖市、计划单列市财政厅......

关于印发《一体式计算机政府采购需求标准(2023年版)》的通知

关于印发《一体式计算机政府采购需求标准(2023年版)》的通知财库〔2023〕31号党中央有关部门,国务院各部委、各直属机构,全国人大常委会办公厅,全国政协办公厅,最高人民法院,最高人民检察院,各民主......

金融机构批量迁移,国产数据库“东风”起

数据库、操作系统和芯片,被视为现代信息技术领域的三大核心,是基础软件“皇冠上的明珠”。随着我国自研数据库能力不断提升,持续经受考验,从银行到保险公司,从到制造企业到新零售行业,越来越多的企业开始将核心......

三个途径解决生成式人工智能知识产权难题

我国目前的生成式人工智能技术创新还处在初级阶段,法律法规的制定应当给科技创新留有一定的发展空间,对产品在研发阶段的数据合法性要求,应当根据数据类型和基本伦理要求,采取开放包容的规范原则。解决生成式人工......

星际富勒烯红外谱数据库的构建与可靠预测取得进展

富勒烯C60的发现起源于人们对星际碳物质的探索,获得1996年诺贝尔化学奖的Kroto教授曾于1980年代末期提出猜想:星际空间中,富勒烯可与其他星际分子/离子通过离子-分子或分子-分子反应形成富勒烯......

研究发布大豆多维组学数据库SoyOmics

大豆(Glycinemax(L.)Merr.)是重要的粮油作物之一,其产量提升、品质改进关乎全球人口的需求和利益。高通量测序技术的发展促使大豆组学研究不断深入。实现大豆多维组学数据的整合分析,将会为大......

应急管理部:建设乡村灾害风险隐患数据库

国务院新闻办公室15日举行新闻发布会。国务院第一次全国自然灾害综合风险普查领导小组办公室副主任、应急管理部风险监测和综合减灾司司长陈胜介绍,下一步,在普查成果转化为乡村自然灾害防治能力的提升上下功夫。......

《永乐大典》高清影像数据库等在国家图书馆发布

发布会现场(崔雪芹摄影)2月8日,《永乐大典》高清影像数据库及《国家珍贵古籍名录》知识库在国家图书馆正式发布。文化和旅游部党组成员、副部长饶权,北京大学党委书记郝平,中宣部出版局局长冯士新,国家图书馆......

中科院在数据库系统正确性保障方面取得进展

近日,中科院软件所软件工程中心数据库系统可靠性保障团队的两篇论文被ICSE2023接收。ICSE(InternationalConferenceonSoftwareEngineering)是软件工程领......