发布时间:2009-07-30 14:14 原文链接: 《自然》社论:数据超载时代来临

  7月30日出版的《自然》杂志刊登社论——《信息超载》(Information overload),社论说,美国国家科学院7月22日发布报告称,应对千千吉(petabyte)科研数据的时代已经到来。而对于每位研究人员来说,要确保其研究数据的真实性与精确性。

  人类基因组谱近30亿碱基对的解析曾花了人类超过十年的时间,但是今天高效的基因测序机器可以在一周之内完成同样的工作。与此同时,美国斯隆数字巡天探测中心的天文学家自2000年以来已经完成了宇宙绘图任务的25%,获得了超过两亿个天体的数据。而预计于2015年完成的智利大口径全景巡天望远镜(LSST)可以在一晚时间内获得与之等量的数据。

  统计数据说明在许多科研领域存在类似情况。这是科研界的利好消息,数据过剩总好于数据匮乏。但是忧虑依然。因为数据产生的速度远远高于数据处理能力和处理策略演进的速度,如期刊编辑要面对诸如图像处理、原始数据保存等问题,需要确保海量数据存储和运算法则、数据共享的持续。

  2006年,包括《自然》在内的多家期刊邀请美国国家科学院关注这一问题,相关研究报告7月22日出炉。报告基于三个原则,即诚信(integrity)、开放获取(access)和管理(stewardship)。

  integrity要求研究人员保证数据的真实性与精确性,他们必须遵循其研究领域的专业标准,研究机构则要求提供培训来实现这一原则。

  access意味着其他人可以核查数据精确与否,并进行验证分析,以及将之作为前期研究基础。除非当事人有特别的理由,否则应该及时使其数据开放获取。

  stewardship是数据长期存储的需要。科学界的协会与社团应该规定数据存储的标准,期刊需要在数据存储和规则传播方面做出努力。数据专家需要扮演管家的角色,研究人员也应该给数据专家更多的支持。

  这份报告承认,基于数据的复杂性,他们只是提供了总体性看法,而非确定的解决方案。科研机构、社团和科学协会应该依据各自的属性来找到解决途径,投资人需要加大对数据存储的投资,而科研单位需要保证面向公众的数据准确。

相关文章

卫生健康信息基本数据编制标准出台,一项面临废止

现发布《集卫生健康信息基本数据编制标准》等2项推荐性卫生行业标准,编号和名称如下:WS/T370—2022卫生健康信息基本数据集编制标准(代替WS370—2012)WS/T811—2022血站信息系统......

Science今晨撤回“天使粒子”论文,张首晟为通讯作者之一

北京时间11月18日凌晨3点,《科学》杂志发布“编辑撤稿”声明,撤回了一篇关于“天使粒子”的论文。这是继2021年3月《自然》撤回一篇该领域研究论文后,马约拉纳费米子研究又一次遭遇国际顶刊撤稿。此次被......

我国小型化自由电子相干光源研究获突破

11月3日,《自然》杂志发表中科院院士李儒新和中科院上海光学精密机械研究所强场激光物理国家重点实验室研究员田野团队在小型化自由电子相干光源研究领域取得的最新成果。研究团队在实验中探索飞秒激光驱动超短电......

“数据驱动的新地学”科学与技术前沿论坛在京举行

10月29至30日,中国科学院学部“数据驱动的新地学”跨学部科学与技术前沿论坛”暨ScienceBulletin第二届地球科学前沿学术沙龙在中国科学院学术会堂举行。此次论坛围绕“数据驱动的新地学”这一......

国家统计局又一数据,这个行业还不稳定

国家统计局服务业调查中心、中国物流与采购联合会10月31日发布数据,10月份,中国制造业采购经理指数(PMI)为49.2%,在调查的21个行业中,有11个位于扩张区间,制造业景气面总体稳定。国家统计局......

施普林格·自然开放获取图书达2000部

施普林格·自然于2012年推出专门的OA图书出版计划,开创OA图书模式。2018年,其OA图书出版计划包括500部OA图书,章节下载量超过3000万。四年之后,其OA图书总产出增至以前的4倍,图书章节......

我国发布更新第二款全球海洋Argo网格数据集

近日,由上海海洋大学和自然资源部杭州全球海洋Argo系统野外科学观测研究站联合研制的全球海洋Argo网格数据集(简称GDCSM_Argo)在国际Argo官方网站正式发布,这是我国在国际上公开发布并定期......

施普林格·自然将提供人工智能语言润色工具

国际知名学术出版机构施普林格·自然15日向媒体发布信息称,继使用人工智能(AI)生成图书等应用之后,其投资并通过投资公司旗下“美国期刊专家”(AmericanJournalExperts,AJE)开发......

研究显示:全球50岁以下人群癌症发病率上升

近几十年来,越来越多的50岁以下成年人患上癌症。美国科学家进行的一项研究显示,早发型癌症(50岁之前被诊断出的癌症,包括乳腺癌、结肠癌、食道癌、肾癌、肝癌和胰腺癌等)的发病率,从1990年开始在世界范......

打造面向开放科学的“数据共享”新未来

“对于全球科技期刊来讲,开放科学带来了学术交流模式的变革,从原来传统的学术交流模式,转向新型的学术交流模式。”8月25日,中国科学院文献情报中心副主任、研究馆员张智雄在第十七届中国科技期刊发展论坛“开......