随着人工智能大模型的不断发展,如何让其在“难”的问题上深入思考,而不是对所有问题“想个不停”?记者5月29日从中国科学院自动化研究所获悉,该所联合鹏城实验室提出了一种高效推理策略AutoThink,可让大模型实现自主切换思考模式,避免“过度思考”。
“当前,越来越多的大模型开始具备‘深度思考能力’。”中国科学院自动化研究所研究员张启超说,模型在回答问题之前要先生成一整段包含反复自我反思、自我验证的推理过程,然后再给出答案。
张启超表示,这一思考模式显著提升了大模型解决复杂问题的能力,但同时也带来了“过度思考”的问题,即在处理简单任务时也会生成冗余的思考过程。
“比如使用者对大模型提问‘2+3等于几’,大模型可能会从自然数定义讲起,列出加法交换律,甚至反复确认,最后才输出答案是5。”张启超说,这种不必要的“过度思考”现象在推理模型中广泛存在。
针对这一问题,AutoThink可赋予推理模型根据题目难度自主切换思考模式的能力,即通过所设计的提示词和多阶段强化学习,引导其自主决定是否进行深度思考。
张启超介绍,AutoThink提供了一种简单而有效的推理新范式——通过省略号提示配合三阶段强化学习,引导大模型不再“逢题必深思熟虑”,而是根据问题难度自主决定“是否思考”“思考多少”。在多个数学数据集上,AutoThink实现了准确率与效率平衡,既提升性能又节省算力,展示出较强的适应性和实用性。
据悉,AutoThink已集成于一站式智能科研平台ScienceOne,并将用于训练ScienceOne的基座大模型S1-Base。研发团队表示,让大模型“更聪明地思考、更简洁地表达”,是未来科学基础大模型演进的重要方向。
随着人工智能大模型的不断发展,如何让其在“难”的问题上深入思考,而不是对所有问题“想个不停”?记者5月29日从中国科学院自动化研究所获悉,该所联合鹏城实验室提出了一种高效推理策略AutoThink,可......
随着人工智能大模型的不断发展,如何让其在“难”的问题上深入思考,而不是对所有问题“想个不停”?记者5月29日从中国科学院自动化研究所获悉,该所联合鹏城实验室提出了一种高效推理策略AutoThink,可......
5月27日,南开大学数学科学学院与多点数智有限公司、智现未来科技有限公司、淡水泉投资管理有限公司正式签署合作共建备忘录,联合启动数学与人工智能实验班项目。根据共建备忘录,数学与人工智能实验班将于202......
近日,我所能源与环境小分子催化研究中心(509组群)邓德会研究员团队与新加坡南洋理工大学李昊博博士团队合作,受邀撰写了人工智能在催化剂设计与合成领域的Perspective评述文章,系统梳理了人工智能......
5月20日,同济大学举行人工智能赋能学科创新行动发展大会,并宣布学校围绕“工程智能”系统布局的首批五大研究院——工程智能研究院、医学人工智能研究院、极端环境建造研究院、自主智能机器人研究院、航空运输与......
在今天(22日)下午召开的商务部例行新闻发布会上,新闻发言人就美国对人工智能芯片出口管制问题进行回应。商务部新闻发言人何咏前:中方已多次阐明立场,美方滥用出口管制,对中国进行遏制打压,违反国际法和国际......
尽管人工智能生成内容已非常流畅,但提供的信息很多时候还是不准确。日本研究人员近日在德国《先进科学》杂志发表的一项研究成果显示,这一问题与人类的语言障碍——失语症类似。新研究成果可以为研究人员改进人工智......
当前,我国生成式人工智能产业发展迅速,相关企业数量已经超过4500家。然而,生成式人工智能与实体经济融合的深度和广度仍有待提升,其巨大潜力尚未充分释放。究其原因,一方面在于生成式人工智能技术本身仍处于......
为深入贯彻落实《国务院办公厅关于全面深化药品医疗器械监管改革促进医药产业高质量发展的意见》以及省委、省政府“数字辽宁,智造强省”的工作部署,推动新一代信息技术与医药产业链深度融合,提高全省医药领域信息......
近日,工业和信息化部与国家标准委联合印发《国家智能制造标准体系建设指南(2024版)》。该指南在2021版的基础上,优化了标准体系框架和标准布局,进一步聚焦人工智能等新技术与制造业的融合应用,在智能装......