发布时间:2014-05-22 09:35 原文链接: 李国杰院士:大数据时代需要新“元素周期表”

李国杰

  “当前,大数据已成为社会热潮。这股热潮的主要驱动力来自网络服务公司,各地政府投资大数据的主要目的则是增加GDP,但其实发展大数据的意义不仅仅体现在经济上。”日前,在清华大学举行的大数据时代高端论坛上,中国工程院院士李国杰表示,发展大数据技术的另一个重要意义是促进社会公平正义,促进国家治理的现代化。“大数据的挖掘分析还能促进科学研究,尤其是基础科学研究的发展。面对大数据浪潮,我们的科学研究也需要作出一定的调整。”

  “大数据就如同蜜蜂,其主要价值是传播花粉,自己生产的蜂蜜价值并不大。”李国杰介绍说,2013年世界范围内狭义的大数据产业产值只有186亿美元,但广义的大数据应用几乎覆盖所有产业。据麦肯锡公司预测,开放数据仅在教育、保健等7个行业便可释放3.2万亿~5.4万亿美元的经济价值。

  然而,在李国杰看来,大数据对社会的贡献并不仅限于经济领域。“大数据分析是认识客观世界的新工具,将开拓计算机科学的新领域——数据科学,同时基于大数据分析的科学研究第四范式必将给全球科技发展带来深刻影响。”

  当前,大数据的发展已给传统计算机科学带来挑战。李国杰坦言,计算机科学是关于算法的科学,传统的图灵计算把“输出值”当成“输入值”的函数,假定输入的数据是随意的,并不关心输入数据之间的相互关系。然而,现在的研究发现,其实输入数据本身也是值得研究的对象。“这就是数据科学要研究的内容。”

  “在某些情况下,小数据条件下好的算法在大数据条件下可能不再适用。反过来,也有一些问题,数据多了反而更容易解决。大数据的兴起导致计算机科学的重点从算法研究向数据科学转移。”李国杰说,目前的大数据技术大多是针对专门应用开发的,其实应研发更加通用的大数据分析和管理技术,发展像关系数据库这样的理论指导海量非结构化Web数据的处理。

  与此同时,越来越多的研究人员开始在数据不断涌现的科学领域摸索,数据驱动型发现也将成为科研的主要形式,熟练应付大数据将很快成为必备技能。对此,李国杰表示,伴随着所有科学都迅速变成“数据科学”,需要在各领域培养既有专业知识又熟悉数据分析的人才,使之拥有分属于不同领域的“双腿”支撑前进。

  此外,李国杰强调,为顺应大数据时代潮流,我们需要重新构建一张以大数据为基础的“门捷列夫周期表”。

  “‘门捷列夫周期表’的发现,为化学成为一门独立科学奠定了重要基础。而在很多学科中,我们也需要对某些基本元素进行系统分析。”李国杰表示,目前生物领域有基因组学,生理学、病理学、制药、干细胞等领域都在研究“基因组”,也有人在讨论人类语言的“基因组”,这些基因组其实都是构成学科整体的基本元素。而发现这些“基因组”需要通过计算机对海量数据进行分析,这导致各学科领域纷纷出现“某某信息学”的分支学科,凸显了大数据在许多学科中的基础性作用。

  “从上世纪70年代开始,围绕计算复杂性,已形成了以算法研究为中心的计算机科学。但随着计算机科学与其他科学的交叉融合,其研究重点将逐步转移到以研究各种基因组学为重点的数据科学。从这个角度来说,现在已经到了发现一张新的‘门捷列夫周期表’的时候了。”李国杰说。

相关文章

粤举办科普大赛讲好“科普故事”激发公众科学兴趣

比赛现场广东省科技厅供图中新网广州6月12日电(王坚王子杰)据广东省科学技术厅12日消息,主题为“热爱科学,崇尚科学”的2023年广东省科普讲解大赛决赛已在广州举行。该赛事以“线上+线下”方式,旨在激......

科学闪光者八旬“火山院士”刘嘉麒:一直在路上

刘嘉麒院士在办公室。82岁的“火山院士”刘嘉麒,近期在北京市委宣传部、市科协等部门组织开展的遴选活动中当选为2023年北京“最美科技工作者”。这是一位非常前卫的爷爷。几十年前就经常脚踩登山鞋,戴着太阳......

既要学会调查,也要擅长研究

调查研究是我们党的传家宝,是做好各项工作的基本功。在学习贯彻习近平新时代中国特色社会主义思想主题教育工作会议上,习近平总书记就“深入调查研究”提出明确要求,强调“注重调研成果转化运用,在调查的基础上深......

“儿童食品”三大问题:噱头大于实质、配料不科学

“六一”儿童节到了。电商促销活动正在进行,“儿童食品”是其中非常畅销的品类。儿童酱油、婴幼儿低钠盐、儿童营养面条、宝宝山楂条……打着专为儿童研发名义的儿童食品真的都是健康的吗?日前,中国青年报社社会调......

中国空间站第四批空间科学实验样品交付实验科学家

从中国科学院获悉,4日上午,中国空间站第四批空间科学实验样品随神舟十五号载人飞船返回舱返回地面,在东风着陆场交付由中科院牵头负责的空间应用系统。4日14时左右,部分实验样品运抵北京中国科学院空间应用工......

2023中国国际大数据产业博览会一线观察

2023中国国际大数据产业博览会于5月26日至28日在贵州省贵阳市举行。会上发布的数据显示,2022年大数据产业规模达1.57万亿元,同比增长18%。“东数西算”带动新产业,大数据与实体经济加速融合,......

“大数据杀熟”行为有了细化认定标准

对于社会关切的“二选一”“大数据杀熟”等平台经济领域垄断行为,如何细化认定?国务院反垄断委员会2月7日发布关于平台经济领域的反垄断指南,国务院反垄断委员会办公室负责同志对指南进行了解读。对“二选一”“......

大数据助力地球系统科学步入数字孪生

地球大数据的爆炸式增长推动着地球系统科学向数据密集型范式(Data-intensiveparadigm)转变,并为破译和解析复杂的地球系统奠定了基础。如何从海量、多源、异构、泛在的地球大数据中汲取所需......

牛津大学最新研究:天气能助力一首歌曲登顶榜首

英国牛津大学和南安普顿大学的研究人员在多年以前做过一项很有意思的研究,发现好多有名的作曲家和歌手都有在作品中写到或唱到有关天气的内容的情况,而且大多以阳光和晴天为主,甲壳虫乐队的歌曲就是其中的典型代表......

中国—上海合作组织大数据合作中心启用

23日,记者从中国—上海合作组织数字技术合作发展论坛(以下简称论坛)上获悉,中国—上海合作组织大数据合作中心正式启用。该论坛由工业和信息化部、上海合作组织秘书处联合主办,中国信息通信研究院和克拉玛依市......