发布时间:2022-07-06 09:04 原文链接: 闫冬梅|搭建共享桥梁的地球大数据管家

闫冬梅 中科院空天信息创新研究院供图

科学大数据,是当今时代的战略性资源,是科技创新发展的重要基础。

2018年,中国科学院正式启动“地球大数据科学工程”先导专项,为“一带一路”“数字中国”、人类命运共同体和联合国可持续发展目标等提供科技支撑和决策支持。

海量数据汇聚于此,如何管理、解析、应用,离不开一位“数据管家”——中科院空天信息创新研究院研究员闫冬梅。

小数据 大世界

“数据”是对我们身边客观世界进行试验或者观察获得的未经加工的原始素材。数据处理的过程,就是寻找规律和逻辑的过程,也是将数据与客观世界相对应的过程。

从小就对数据格外感兴趣的闫冬梅,2000年考入了当时的中科院遥感应用研究所,攻读遥感图像处理博士研究生。其间,闫冬梅通过卫星遥感影像领略了地球之美。一张张全国遥感影像图,恰似一幅幅中国水墨丹青。

真正让闫冬梅感叹的是,卫星遥感影像不仅为我们展现了地球之美,还有更为重大的科学价值和现实意义。图中的每个像素,在自然中都是有着实际意义的数据,有了这些数据,人们不必再翻山越岭进行大量的实地勘测,只需根据数据和少量的地面实测就能绘制出专业地图,服务自然资源调查、环境监测评价、区域分析规划及全球宏观研究。

单就制作修订一幅全国地图来讲,遥感制图方法和传统勘测方法相比,效率提高了至少10倍以上。了解了“数据”的精髓后,如何提高遥感数据的处理精度和效率、提高数据的精准服务能力,成为闫冬梅此后一直奋斗的目标。

闫冬梅博士毕业后的15年间,全球和中国的数据获取能力飞速提升。随着对地观测技术的进步和对地观测卫星的密集发射,中国已经进入地球大数据时代。

大数据可以根据各数据要素之间在时间、空间上的关联关系,通过数据融合和挖掘技术来探究数据背后的本质信息,成为观察人类社会和地球的“显微镜”和“透视镜”。大数据之“大”,在于众多“小数据”的汇集。但是,由于数据采集历史和管理等各种各样的原因,在科研机构和行业应用部门中存在大量的“数据孤岛”,导致数据汇聚困难,最终无法形成大数据的合力。因此,建立数据的标准规范、推动数据共享迫在眉睫。

2018年1月,中科院启动为期5年的“地球大数据科学工程”先导科技专项,并在专项负责人郭华东院士和总体组的带领下,成立了数据共享工作组和课题组。闫冬梅任课题负责人和数据共享工作组的副组长,开始了对大数据的梳理、清洗和开放共享工作,成为了一名“数据管家”。

抽丝剥茧 厘清海量数据

作为地球大数据专项的“数据管家”,闫冬梅和同事们要面对来自国内外129家科研单位的海量、多学科的异构数据。海量数据存储、数据交互、网络传输、数据管理、质量控制等,成为闫冬梅工作中绕不开的难题。

万事开头难,建立“数据共享台账”是立项之初专项总体组下达的第一项关于数据的任务。闫冬梅和来自中科院资源、环境、生物、生态等多学科的科研人员,历时半年着手调研分析了对地观测、野外台站、生物多样性和生态安全以及大气海洋等多种数据资源现状,并进行趋势分析与预测,形成了数据共享工作的明细账,明确了专项“5年汇聚17PB数据资源”的目标,并基于台账基础,在中科院率先建立了科学数据管理年度工作计划。

闫冬梅带领团队继续迎难而上,面对问题抽丝剥茧,构建数据汇交、质量评估、共享服务等全生命周期的数据开放服务体系。她带领团队专家创新性地提出数据共享新范式,打造“大数据存储—云服务分析处理—高性能计算—数据出版共享”集成模式,实现“数据—成果”的一站式生产与共享,加快大数据环境下的多领域、多学科数据交叉融合与深度挖掘,形成地球大数据的价值链。

肩扛“国家责” 奋斗在一线

无论是在科研一线还是在管理岗位,闫冬梅一直致力于数据共享工作,兢兢业业地扮演着“数据管家”的角色。

2020年,闫冬梅组织出版了《地球大数据科学工程数据共享蓝皮书》。截至2022年6月,专项数据共享服务系统收集、整编了中国科学院多个领域的地球大数据资源,总数据量超过14PB,汇集40年卫星影像数据,其中卫星影像产品460万景、生物生态数据7.6PB、遥感数据4.8PB,在线访问量超9374万次,累计下载超102万次,用户遍布全球174个国家和地区,成为我国地学领域科学数据共享最具影响力的数据服务平台之一。

2010年青海玉树地震、2013年四川雅安地震等十余次重大灾害应急遥感监测数据和灾情评估信息的共享工作,也都由闫冬梅牵头协调完成,并为科技救灾入选“中国科学院改革开放四十年40项标志性科技成果”奠定了坚实的空间数据基础。

2010年青海玉树地震发生后,闫冬梅第一时间组织部署数据共享工作,在地震发生当日实现了航空、卫星遥感数据共享发布,并向国务院应急办、地震局等16个国家部委提供了全部共享数据。同时,在新浪网站上发布的31张灾区高分辨率航空遥感影像图,是国内首次灾害高分辨率遥感影像对公众开放,累计总浏览量逾2000万次,形成了科技救灾的良好社会反响。

相关文章

数据“中毒”会让AI“自己学坏”

在一个繁忙的火车站,监控摄像头正全方位追踪站台的情况,乘客流量、轨道占用、卫生状况……所有信息实时传输给中央人工智能(AI)系统。这个系统的任务是帮助调度列车,让它们安全准点进站。然而,一旦有人恶意干......

国家数据局召开推动地方数据集团创新发展专题座谈会

为推动地方数据集团创新发展,服务全国一体化数据市场培育建设,7月23日,国家数据局组织召开座谈会。国家数据局党组书记、局长刘烈宏出席会议并讲话,局党组成员、副局长沈竹林、夏冰、余英出席会议。局党组成员......

智能化养猪助力育种领域全新探索

随着人工智能(AI)、自动化等技术的持续突破,利用传感器进行数据采集与高速传输,并通过物联网存储海量数据,正持续推进智能化养殖业发展,逐渐成为推动猪育种向精准化、高效化、智能化转型的核心驱动力。从整个......

国知办印发《知识产权数据使用手册及开放目录》

国家知识产权局办公室关于印发《知识产权数据使用手册及开放目录》的通知国知办函服字〔2025〕153号各省、自治区、直辖市和新疆生产建设兵团知识产权局,各地方有关中心:为促进知识产权数据开发利用,提高知......

研究揭示地方真实数据在全球疾病负担研究中的重要性

2月23日,记者从海南医科大学获悉,该校热带医学院杨国静教授团队近日在国际医学期刊《英国医学杂志》在线发表论文《中国被忽视热带病负担估计的差异:真实世界数据与GBD2021的比较研究(2004—202......

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......

“人民数据数融平台”上线试运行

 12月28日,由人民数据开发的“数融平台”正式上线试运营。平台整体依托区块链、人工智能和企业经营相关数据要素,实现链上信息全透明、全上链,实现数据资产情况全穿透,实时追踪一手风控数据,对潜......

五部门制定数据产业发展促进政策

随着新一轮科技革命和产业变革深入发展,数据作为关键生产要素的价值日益凸显。五部门:制定数据产业发展促进政策近日,国家数据局联合中央网信办、工业和信息化部、公安部、国务院国资委印发了《关于促进企业数据资......

基金委“数据市场制度设计与关键技术”专项项目评审会召开

2024年12月3日,自然科学基金委管理科学部、信息科学部在北京召开专项项目“数据市场制度设计与关键技术”评审会议。自然科学基金委党组成员、副主任江松院士出席会议并讲话。国家数据局政策与规划司副司长栾......

数据流通市场的基础理论与治理方法项目指南

2024年度国家自然科学基金指南引导类原创探索计划项目“数据流通市场的基础理论与治理方法”项目指南以数据要素为核心引擎推动数字经济深化发展,有利于构建新发展格局、建设现代化经济体系、构筑国家竞争新优势......