发布时间:2022-03-18 14:35 原文链接: 打造空间科学数据仓储的中国品牌

  中国科学院国家空间科学中心怀柔园区6号科研大楼,是国家空间科学数据中心总部的所在地。

  中心的专用机房大约400平米左右,存储运行着我国不少空间科学“大国重器”的数据资源。“悟空”“墨子”“慧眼”“太极一号”等空间科学卫星,子午工程、海南空间天气国家野外科学观测研究站都是这里的“住户”。

  这是一个什么样的数据中心?为什么能赢得这么多大咖级“住户”的青睐?日前,《中国科学报》记者走进国家空间科学数据中心一探究竟。

  30余年坚守,把种子变成绿荫

  从萌芽算起,国家空间科学数据中心已经34年岁了。

  1988年,在国际地球物理年活动上,以中国科学院作为牵头机构,中国参与了名为“世界数据中心”(WDC)的国际科学数据合作计划,并成立起“世界数据中心中国中心”。

  世界数据中心中国中心由九个学科中心构成的,空间科学成为其中的一个学科。

  “为什么做这件事?因为那时我国不像现在这样,有能力主导一个大型的空间观测项目,当时各自国家都主导了一些观测工作,我们加入是为了通过数据共享和数据交换,获取更多外国的数据来开展科学研究。”国家空间科学数据中心主任、中科院国家空间科学中心副主任邹自明说。

  当时,中国科学院空间科学与应用研究中心(中科院国家空间科学中心前身)已经开展了空间科学数据工作,但只是作为研究室里的一项业务而存在。在中国空间环境预报学科的创始人都亨先生的带领下,空间科学数据工作加入了这项计划。

  2003年,原先处于“种子”阶段的国家空间科学数据中心,从一项数据业务发展成中科院国家空间科学中心的一个独立部门——中国空间科学数据中心。2007年,中国空间科学数据中心成为国家地球系统共享服务平台空间科学数据中心。

  “科技创新必须依赖于科学数据。”在包括邹自明在内的空间科学数据工作者心中,这是数据中心发展最根本的动力。

  2013年,WDC转变为世界数据系统(WDS),通过不懈地坚持,中国空间科学数据中心成为了WDS的正式成员。2019年6月,中国空间科学数据中心正式成为首批20个国家科学数据中心之一,并更名为“国家空间科学数据中心”。

  从1988年到2019年,原先那颗小小的种子,成长成了能为我国空间科学数据遮风挡雨的绿荫。

  担起“国家责”,数据就是话语权

  成为国家级的空间科学数据中心之后,邹自明等人心中的使命感越发强烈。

  “数据就是话语权,我们一直在努力打造国际空间科学数据仓储系统的中国品牌。”邹自明说。

  数据仓储系统,是具有综合组织重要数据的能力,并能够对海量数据进行快速和准确分析的决策支持系统。

  之所以要做这件事,源于他们对国家数据仓储安全的危机感。“国际上很多顶刊要求公开论文数据,必须将数据放到一个他们认可的数据中心去。”邹自明说,比方说,美国地球物理联合会(AGU)认定了一批数据仓储平台,学会旗下的所有期刊,都要求公开科学数据。

  与国家空间科学数据中心萌芽之初相比,如今,我国主导的空间科学项目已经越来越多,空间科学卫星、大科学装置、野外台站都是产生数据的“大户”,如何保护好数据知识产权,成为新时期的新课题。

  “如果没有一个国际认可的数据中心,中国科学家的数据就只能放在国外的平台。论文投得越多,出境的数据就越多,出境之后数据安全没有任何保障。”邹自明说。

  他们在国际场合一次次努力,2019年,在WDS正式会员身份的助力下,国家空间科学数据中心终于获得了AGU的认可,成为向AGU旗下的期刊文章投稿时可选的可靠领域数据仓储中心。2020年10月,他们又通过了CoreTrustSeal国际数据中心资质认证,成为亚太地区空间领域首家通过认证的数据中心。

  提升服务质量,做好开放应用

  数据质量决定了数据是否会被接受,而数据一旦被科学共同体接受和认可,则会在无形中进一步强化数据的可信度。因此,如今的国家空间科学数据中心在提升数据质量上,一刻不停地努力着。

  关于什么是“高质量的数据产品”,邹自明心中有一个标尺:“我给用户一堆数据,首先是看用户要能看得清楚明白,这与数据的规范性有关,然后是这些数据要可信,这与数据的客观性有关。”

  邹自明介绍,数据的规范性涉及格式描述得是否清楚,辅助信息是否完善,使用者拿到数据之后会不会引发歧义;数据的客观性涉及数据是否反映了观测的真实情况。

  这些年,为了提升数据的规范性,国家空间科学数据中心主攻标准体系。“目前,国家空间科学数据中心的科学领域数据标准体系,已经从资源描述、操作活动、过程管理三个维度,贯穿了空间科学数据全生命周期流程。”国家空间科学数据中心副主任、中科院国家空间科学中心副研究员佟继周介绍,中心牵头或参与起草了国家标准20余项,起草团体标准、项目标准10余项。

  对于数据的客观性问题,国家空间科学数据中心则采取了“倒逼”策略。““数据的客观性不能光靠数据中心的数据工作来实现,更重要的是要靠科研仪器来实现。。”邹自明说,要提升数据质量和可信度,就要在科学仪器研制时做更多的标定实验,在仪器运行时积累更多的统计量。

  邹自明介绍,为了控制数据质量,国家空间科学数据中心的研发人员研发出科研项目数据管理过程模型,并将模型推给各个科研项目的负责人,作为项目负责人完善科学数据质量的参考。

  和很多国家科学数据中心的负责人一样,邹自明也在各种场合推动数据论文出版工作并呼吁科学家们参与其中:“你必须把你的数据公开,放到一个国际认可的数据仓储系统中去,才能真正保护你们的数据知识产权,提升数据的认可度。”

  “现在,我们依然希望这个‘朋友圈’可以再广一点,大家一起把数据开放共享的事情做好。”邹自明说。

image.png

国家空间科学数据中心团队(国家空间科学数据中心供图)

相关文章

智能化养猪助力育种领域全新探索

随着人工智能(AI)、自动化等技术的持续突破,利用传感器进行数据采集与高速传输,并通过物联网存储海量数据,正持续推进智能化养殖业发展,逐渐成为推动猪育种向精准化、高效化、智能化转型的核心驱动力。从整个......

国知办印发《知识产权数据使用手册及开放目录》

国家知识产权局办公室关于印发《知识产权数据使用手册及开放目录》的通知国知办函服字〔2025〕153号各省、自治区、直辖市和新疆生产建设兵团知识产权局,各地方有关中心:为促进知识产权数据开发利用,提高知......

研究揭示地方真实数据在全球疾病负担研究中的重要性

2月23日,记者从海南医科大学获悉,该校热带医学院杨国静教授团队近日在国际医学期刊《英国医学杂志》在线发表论文《中国被忽视热带病负担估计的差异:真实世界数据与GBD2021的比较研究(2004—202......

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......

“人民数据数融平台”上线试运行

 12月28日,由人民数据开发的“数融平台”正式上线试运营。平台整体依托区块链、人工智能和企业经营相关数据要素,实现链上信息全透明、全上链,实现数据资产情况全穿透,实时追踪一手风控数据,对潜......

五部门制定数据产业发展促进政策

随着新一轮科技革命和产业变革深入发展,数据作为关键生产要素的价值日益凸显。五部门:制定数据产业发展促进政策近日,国家数据局联合中央网信办、工业和信息化部、公安部、国务院国资委印发了《关于促进企业数据资......

基金委“数据市场制度设计与关键技术”专项项目评审会召开

2024年12月3日,自然科学基金委管理科学部、信息科学部在北京召开专项项目“数据市场制度设计与关键技术”评审会议。自然科学基金委党组成员、副主任江松院士出席会议并讲话。国家数据局政策与规划司副司长栾......

数据流通市场的基础理论与治理方法项目指南

2024年度国家自然科学基金指南引导类原创探索计划项目“数据流通市场的基础理论与治理方法”项目指南以数据要素为核心引擎推动数字经济深化发展,有利于构建新发展格局、建设现代化经济体系、构筑国家竞争新优势......

国家计量科学数据中心“计量与数字化”学术会议在恩施市顺利召开

10月21日下午和10月22日上午,国家计量科学数据中心在恩施市接续2024年度工作会召开了“计量与数字化”学术会议。本次会议共安排了13场精彩的学术报告,展出了系列学术墙报,并为学术墙报获奖者颁奖。......

国家计量科学数据中心2024年度工作会暨“计量与数字化”学术会议恩施州开幕

金秋十月,丹桂飘香。2024年10月21日,国家计量科学数据中心2024年度工作会暨“计量与数字化”学术会议在湖北省恩施州顺利召开。本届大会由中国计量科学研究院主办,湖北省计量测试技术研究院和恩施州计......