发布时间:2014-05-22 09:35 原文链接: 李国杰院士:大数据时代需要新“元素周期表”

李国杰

  “当前,大数据已成为社会热潮。这股热潮的主要驱动力来自网络服务公司,各地政府投资大数据的主要目的则是增加GDP,但其实发展大数据的意义不仅仅体现在经济上。”日前,在清华大学举行的大数据时代高端论坛上,中国工程院院士李国杰表示,发展大数据技术的另一个重要意义是促进社会公平正义,促进国家治理的现代化。“大数据的挖掘分析还能促进科学研究,尤其是基础科学研究的发展。面对大数据浪潮,我们的科学研究也需要作出一定的调整。”

  “大数据就如同蜜蜂,其主要价值是传播花粉,自己生产的蜂蜜价值并不大。”李国杰介绍说,2013年世界范围内狭义的大数据产业产值只有186亿美元,但广义的大数据应用几乎覆盖所有产业。据麦肯锡公司预测,开放数据仅在教育、保健等7个行业便可释放3.2万亿~5.4万亿美元的经济价值。

  然而,在李国杰看来,大数据对社会的贡献并不仅限于经济领域。“大数据分析是认识客观世界的新工具,将开拓计算机科学的新领域——数据科学,同时基于大数据分析的科学研究第四范式必将给全球科技发展带来深刻影响。”

  当前,大数据的发展已给传统计算机科学带来挑战。李国杰坦言,计算机科学是关于算法的科学,传统的图灵计算把“输出值”当成“输入值”的函数,假定输入的数据是随意的,并不关心输入数据之间的相互关系。然而,现在的研究发现,其实输入数据本身也是值得研究的对象。“这就是数据科学要研究的内容。”

  “在某些情况下,小数据条件下好的算法在大数据条件下可能不再适用。反过来,也有一些问题,数据多了反而更容易解决。大数据的兴起导致计算机科学的重点从算法研究向数据科学转移。”李国杰说,目前的大数据技术大多是针对专门应用开发的,其实应研发更加通用的大数据分析和管理技术,发展像关系数据库这样的理论指导海量非结构化Web数据的处理。

  与此同时,越来越多的研究人员开始在数据不断涌现的科学领域摸索,数据驱动型发现也将成为科研的主要形式,熟练应付大数据将很快成为必备技能。对此,李国杰表示,伴随着所有科学都迅速变成“数据科学”,需要在各领域培养既有专业知识又熟悉数据分析的人才,使之拥有分属于不同领域的“双腿”支撑前进。

  此外,李国杰强调,为顺应大数据时代潮流,我们需要重新构建一张以大数据为基础的“门捷列夫周期表”。

  “‘门捷列夫周期表’的发现,为化学成为一门独立科学奠定了重要基础。而在很多学科中,我们也需要对某些基本元素进行系统分析。”李国杰表示,目前生物领域有基因组学,生理学、病理学、制药、干细胞等领域都在研究“基因组”,也有人在讨论人类语言的“基因组”,这些基因组其实都是构成学科整体的基本元素。而发现这些“基因组”需要通过计算机对海量数据进行分析,这导致各学科领域纷纷出现“某某信息学”的分支学科,凸显了大数据在许多学科中的基础性作用。

  “从上世纪70年代开始,围绕计算复杂性,已形成了以算法研究为中心的计算机科学。但随着计算机科学与其他科学的交叉融合,其研究重点将逐步转移到以研究各种基因组学为重点的数据科学。从这个角度来说,现在已经到了发现一张新的‘门捷列夫周期表’的时候了。”李国杰说。

相关文章

2024首届分析科学与仪器大会质谱分会:聚焦前沿,引领突破,共创卓越

2024年11月9日至11日,首届分析科学与仪器大会“8分会-质谱科学与仪器”在成都天府国际会议中心成功举办。本分会由中国分析测试协会主办、中国科学院大连化学物理研究所张玉奎院士、国家自然科学基金委员......

科学研究证实:睡不好就会生病

睡眠对心血管健康至关重要,但连接心血管病理和睡眠的回路尚不清楚。10月30日,一项发表于《自然》的新研究发现,心脏病发作后,免疫细胞会迅速涌向大脑并促进深度睡眠,这种深度睡眠通过缓解心脏炎症促进康复。......

《铺设通往科学之路——面向变革时代的科技馆》出版采购项目评审结果

中国科学技术馆发布《铺设通往科学之路——面向变革时代的科技馆》出版采购项目评审结果公告公告原文:各有关单位:按照《中国科协采购管理办法》有关规定,本项目分别于2024年9月18日和10月8日发布了申报......

药典委开始征集药用辅料标准研究用样品(2024年第三批)

国家药典委员会发布关于征集药用辅料标准研究用样品的通知(2024年第三批)。原通知如下:各相关单位:2024年我委将继续组织开展《中国药典》药用辅料标准研究。为增强药用辅料标准研究用样品的代表性,确保......

开放科学基础设施共享协作倡议发布

23日,2024年世界科技与发展论坛主题会议在中国科技会堂举行。在开放科学基础设施相关主题会议上,开放科学基础设施共享协作倡议正式发布。该倡议提出四方面行动:共建全球网络,增加开放科学基础设施的数量并......

国家计量科学数据中心“计量与数字化”学术会议在恩施市顺利召开

10月21日下午和10月22日上午,国家计量科学数据中心在恩施市接续2024年度工作会召开了“计量与数字化”学术会议。本次会议共安排了13场精彩的学术报告,展出了系列学术墙报,并为学术墙报获奖者颁奖。......

支持“塔基”青年科技人才科协启动实施青年人才托举工程博士生专项计划

记者从中国科协10日召开的新闻发布会上获悉,为让更多刚刚踏上科研道路,处于人才梯队“塔基”、职业生涯“破茧期”的青年人才受益,中国科协近日启动实施青年人才托举工程博士生专项计划,面向高年级在读博士研究......

“集成芯片前沿技术科学基础”重大研究计划2025年度项目指南建议通告

关于征集“集成芯片前沿技术科学基础”重大研究计划2025年度项目指南建议的通告国家自然科学基金重大研究计划“集成芯片前沿技术科学基础”2025年度项目指南建议征集已通过科学基金网络信息系统(https......

12省/直辖市超千亿!2023年全国科技经费投入统计公报

2023年,全国研究与试验发展(R&D)经费投入保持稳定增长,投入强度持续提升,基础研究投入取得新进展,国家财政科技支出稳步增加。一、研究与试验发展(R&D)经费情况2023年,全国共......

90后学者用“谁也不看好的方法”成功破题!

文|卜金婷2021年的一整年,刘俣都在经历失败。这是刘俣在美国国家标准技术研究所(NIST)做博士后的第一年,他转换了研究方向。彼时,凭借“初生牛犊不怕虎”的干劲,刘俣一入门就接手了一个大难题:利用分......