近日,由中国计算机学会主办的第21届全国高性能计算学术大会在内蒙古鄂尔多斯召开。大会上,中国工程院院士、中国计算机学会理事长孙凝晖在题为《AI(人工智能)赋能科学发现》报告中,分享了对这一备受关注话题的思考。

  “第五范式”登上历史舞台

  孙凝晖首先谈到,“科学智能”是AI for Science,即“AI赋能科学发现”。这一研究范式的出现,始于AlphaFold在蛋白质结构预测上的突破。2020年,AlphaFold在CASP14大赛中成功预测了2/3的目标蛋白结构,开启了基于AI预测蛋白、核酸等分子结构的历史进程。

  2024年诺贝尔物理学奖和化学奖授予AI基础理论和科学发现领域的科学家,展现了对AI的“偏爱”。孙凝晖认为,这标志着国际学术界公认AI技术已进入科学领域,“代表着科研范式的重大改变”。

  “融合大模型、大算力、大数据和大团队服务等特点的科学研究,对科学发现的作用就像大科学装置一样,是一个新范式。”孙凝晖说,新范式的形成,除了“大模型、大算力、大数据”外,还离不开物理、化学、生物、AI等各领域科学家和工程师团队的长期工作,以及企业资金的支持。

  孙凝晖表示,在“AI赋能科学发现”之前,现代科学活动存在4种范式,即基于实验观察的科学实验范式、依赖科学家的理论推演范式、借助计算设备的科学计算或数值模拟范式、基于实验和理论数据计算的科学数据范式。如今,“AI赋能科学发现”当属“第五范式”,正登上历史舞台。

  帮助科学家从“增肌强体”到“赋予大脑”

  AI如何赋能科学发现?孙凝晖提出,从信息化视角看,“AI赋能科学发现”的核心在于构建观测(Observe)、模拟(Orient)、猜想(Hypothesis)与实验(Verify)4个环节,并将数据驱动和智能算法驱动引入这4个环节,形成“OOHV全环的AI赋能”。

  “在这4个环节中,信息技术总能发挥作用,让知识获取、分享、检索、交换更方便,让信息抽取更简单。”孙凝晖谈到,推演模拟环节本质上是“高性能计算+AI”,而机器学习、大模型能通过处理科学数据发现规律、验证猜想,此外,观察和实验未来也可依靠具身智能。

  从具体案例看,孙凝晖认为,信息学科的主要任务是提供工具。他有一个形象的比喻:信息技术赋能科学的手段如同从“增强肌肉(算力)”到“提供营养”(数据),如今正朝着“赋予大脑”(AI)的方向进化。

  “‘AI赋能科学发现’更大的作用是突破人类认知极限,这也是科学研究的最高追求。”孙凝晖说,人类在第三范式和第四范式下都有许多突破认知极限的工作,比如通过科学计算,我们既能做公里级精度的中短期天气预报,也能做全球尺度的气候变化预测;通过数据解析,人类得以从基因组层面认识自己,利用天文望远镜摸到黑洞的“脉搏”。如今,在“第五范式”下也有突破人类认知极限的工作。

  不过,孙凝晖提醒,AI工具并不是万能的,科学发现依然离不开高性能计算这一基础手段。同时,在解决实际科学问题时,如何对齐“AI赋能科学发现”共性工具的科学语义,将成为一个关键问题。

  崭新的方法论和学术生态正在形成

  孙凝晖剖析了“AI赋能科学发现”面临的数据、模型和计算问题。“科学数据大概来自4个方面,即理论数据、观测数据、实验数据和知识数据,‘AI赋能科学发现’数据集不仅需要长期积累,还需要关注数据的AI-Ready化与成熟度。”孙凝晖表示。

  在模型方面,孙凝晖提到,OpenAI将实现通用人工智能的路径分为5个阶段:对话者、推理者、代理者、创新者、组织者。这5个阶段对应的AI依次加入了数据驱动、知识嵌入、物理约束、人机协同、群体智能的能力。目前,“AI赋能科学发现”的能级正处于“数据驱动+知识嵌入+物理约束”的三轮驱动阶段。

  在孙凝晖展示的能级图中,AI进阶像“单车”到“高铁”那样循序渐进。仅靠数据驱动的AI仿佛“单轮车”,随着知识嵌入,AI成了“自行车”;加入物理约束后,AI堪比“三轮摩托车”;而随着人机协同、群体智能等更多“车轮”的加入,AI有望变成“跑车”“高铁”,将大大加速人类科学发现的进程。

  在计算问题上,孙凝晖提到,衡量计算有两个关键维度,即精度和架构。“AI赋能科学发现”不仅需要高精度计算,还需要能够降低负载的融合架构。他表示,未来智算的融合架构是什么样,成为计算机科学家需要思考的问题。

  孙凝晖展望说,随着算力集群的堆叠、数据来源的多样化、模型参数规模等的进一步提升,未来算力将进化成为Z级(每秒可进行1021次浮点运算)智能超算,数据方面将发展为由海量常识数据、高质量理论数据、实验数据及增强数据来解决更复杂的问题,模型方面将出现一个参数量超过千亿的通用科学智能大模型。

  孙凝晖认为,随着AI技术对科学研究范式的重构,新研究工具链涌现,顶级期刊开设专栏,全球顶尖机构成立相关或专门研究单元,崭新的“AI赋能科学发现”方法论和学术生态正在形成。

相关文章

解锁“AI+分析”新可能第十届中国分析仪器学术大会(ACAIC2025)西安隆重启幕

2025年11月7日,第十届中国分析仪器学术大会(ACAIC2025)在陕西西安隆重开幕。本届大会由中国仪器仪表学会分析仪器分会主办,西安交通大学承办,JournalofPharmaceuticalA......

解锁“AI+分析”新可能第十届中国分析仪器学术大会(ACAIC2025)西安隆重启幕

2025年11月7日,第十届中国分析仪器学术大会(ACAIC2025)在陕西西安隆重开幕。本届大会由中国仪器仪表学会分析仪器分会主办,西安交通大学承办,JournalofPharmaceuticalA......

研究构建超万张人类图像数据库,评估AI视觉偏见

国际知名学术期刊《自然》最新发表一篇人工智能(AI)研究论文,提出并构建了一个超过1万张人类图像的数据库,旨在评估AI模型在以人为本的计算机视觉领域中的偏见。这一“公平的以人类为中心的图像基准”(FH......

研究构建超万张人类图像数据库,评估AI视觉偏见

国际知名学术期刊《自然》最新发表一篇人工智能(AI)研究论文,提出并构建了一个超过1万张人类图像的数据库,旨在评估AI模型在以人为本的计算机视觉领域中的偏见。这一“公平的以人类为中心的图像基准”(FH......

科技造就质量强国建设新标尺

走进福建辅布司产业园生产车间,只见织机旁的高清摄像头格外醒目,它们连接着由该公司与华为联合推出的人工智能(AI)质检系统。该系统基于昇腾AI平台,每秒可处理60帧图像,能够清晰记录蕾丝花边的每一处细微......

科技造就质量强国建设新标尺

走进福建辅布司产业园生产车间,只见织机旁的高清摄像头格外醒目,它们连接着由该公司与华为联合推出的人工智能(AI)质检系统。该系统基于昇腾AI平台,每秒可处理60帧图像,能够清晰记录蕾丝花边的每一处细微......

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......

AI融合赋能四大主题深耕,第三届天津生物及临床质谱论坛圆满召开!

2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......