大型语言模型可以完成阅读文献、撰写论文、审查论文的所有工作。图片来源:《自然》网站
科研过程可以完全自动化吗?一个研究机器学习的国际团队正在勇闯“无人区”。
据《自然》网站近日报道,日本Sakana AI公司和加拿大、英国科学家携手,创建了一种基于大语言模型的“人工智能(AI)科学家”。从阅读文献到提出新假设,再到尝试各种解决方案并撰写论文,整个研究周期,“AI科学家”能一气呵成。
Sakana公司在其官网表示,这位科研“新星”是首个用于自动化科研和开放式发现的综合AI系统,标志着科学发现新时代的开始。尽管它展现出非凡的潜力,但目前并不完美,应警惕“AI科学家”被滥用的风险。
推进流程行云流水
AI技术不断进步,让科学家能借助一些模型来集思广益或编写代码。然而,这些模型仍然需要大量人工监督,或仅囿于执行特定任务。
那么,能否利用基础模型将整个科研过程自动化呢?包括加拿大不列颠哥伦比亚大学机器学习专家在内的团队,成功创建出首位“AI科学家”。
在想法生成阶段,该“AI科学家”基于一个起始模板,先进行“头脑风暴”,提出多个不同研究方向,并进行广泛搜索,以确保某些想法是新颖且有趣的;在实验迭代阶段,对于第一阶段提出的某个想法,“AI科学家”会先开展实验,然后生成图表可视化结果,并给每个图表添加注释;在论文写作阶段,它会模仿标准机器学习会议的风格,撰写出一份文字简练、内容丰富的论文,并自主查找相关论文进行引用;在自动化同行评审阶段,研究团队开发出一个自动化的“AI审稿人”,其评估生成论文的准确性堪与人类相媲美。评估结果和建议可用于改进该项目,实现持续的反馈循环,使“AI科学家”能够迭代改进其研究成果。
在最初的演示中,该“AI科学家”针对扩散模型、Transformer模型(一种用于处理语言数据的神经网络模型),以及AI“领悟”(grokking)等机器学习子领域进行了深入研究,总共生成了10篇论文,每篇论文的成本约15美元。
美国华盛顿大学计算社会科学家杰文·韦斯特表示,该“AI科学家”行云流水般完成了整个科研流程,令人印象深刻,有望加速科学发现的步伐。
功能远非尽善尽美
尽管这位“AI科学家”潜能巨大,但它远非尽善尽美。
Sakana AI公司指出,“AI科学家”目前还不具备视觉功能,因此无法修复论文中出现的图表问题。例如,它生成的图表有时无法读取,表格有时会超出页面范围,页面布局也并不美观。
此外,该“AI科学家”有时会出现想法正确但执行错误的情况,也会因比较不当而生成误导性的结果。在撰写论文和评估结论时,它还可能会犯严重错误。例如,它很难比较两个数字的大小,这是大语言模型的“通病”。为了部分解决这个问题,研究团队确保所有实验结果都可以重复,并存储了所有执行文件。
研究人员预计,未来多模态模型“加入战局”,将助该“AI科学家”一臂之力。
另外,该“AI科学家”只能开展机器学习领域的研究,且缺乏科研过程的关键部分:动手进行实验的能力。
艾伦人工智能研究所计算机科学家汤姆·霍普表示,目前该大语言模型“仍无法提出并制定新颖有用的科学方向”。劳伦斯伯克利国家实验室材料科学家赫布兰德·希德则认为,即使该系统在短期内无法完成更具创造性的工作,仍可将科研过程中一些重复性内容自动化。
Sakana AI也强调,此类系统能否提出真正的变革型想法仍未有定论。未来的“AI科学家”能否发明出像人工神经网络或信息论一样的概念也还是个未知数。
能力越强越需慎用
研究人员表示,为扩大该“AI科学家”的能力,让其能够研究更抽象的领域,如纯数学领域,可能需要调遣语言模型之外的其他技术。
例如,解决数学问题需要逻辑推理,而目前大多数AI模型都不擅长逻辑推理。鉴于此,谷歌深度思维公司开发出AlphaGeometr,将语言模型与符号引擎(使用符号和逻辑规则进行推理)相结合,构建出一种神经—符号混合系统。在今年的奥林匹克数学竞赛中,升级后的AlphaGeometry2在19秒内就解答出一道题,令人类选手望尘莫及。
研究人员坚信,目前的迭代只是个开始。“AI科学家”就像AI科研自动化领域的GPT-1。随着不断迭代,它将如目前的GPT-4一样,引发新的科研革命。
不过,与许多新技术一样,“AI科学家”也打开了“潘多拉魔盒”,甚至可能被滥用。
譬如,“AI 科学家”能自动创建论文并提交,这将显著增加审稿人的工作量,可能阻碍科学质量控制,并给学术进步带来压力。而且,“AI科学家”还可能被用来制造危险的病毒,给人类社会带来潜在危害。
化学是一门研究物质组成、结构、性质与变化规律的学科,其发展史是人类突破自然表象、揭示物质本质的历史。从古代炼金术士对“点石成金”的痴迷,到现代科学家操控原子合成新物质,在好奇心的驱动下,人类正不断向着......
一、文件制订背景近年来,党中央、国务院高度重视人工智能发展,2025年8月国务院印发《关于深入实施“人工智能+”行动的意见》(国发〔2025〕11号),要求探索推广人人可享的高水平居民健康助手,有序推......
国家卫生健康委办公厅、国家发展改革委办公厅等五部门发布关于促进和规范“人工智能+医疗卫生”应用发展的实施意见通知。国卫办规划发〔2025〕30号各省、自治区、直辖市及新疆生产建设兵团卫生健康委、发展改......
10月31日,中国科学院第四届职工技能大赛人工智能领域比赛决赛在中国科学院自动化研究所成功举办。院直属机关党委常务副书记、院工会主席房自正,院直属机关党委副书记、院工会常务副主席杨旭,自动化研究所所长......
工业和信息化部党组书记、部长李乐成在《党建》杂志发表署名文章《加快推进人工智能赋能新型工业化》。文章指出,“面对新一代人工智能技术快速演进的新形势,要充分发挥新型举国体制优势,坚持自立自强,突出应用导......
2025年世界科技与发展论坛虽已落下帷幕,“人工智能促进科技与发展”的主题仍在全球科技界激荡回响。在业界看来,这场论坛不仅展现了中国智造的技术硬实力,更清晰传递出一个核心信号:“开放合作”的包容姿态与......
近日,由中国科学技术协会主办的2025年世界科技与发展论坛在北京举行。作为中国科协“开放合作月”重要活动之一,本届论坛以“人工智能促进科技与发展”为主题,围绕人工智能与未来产业、开放科学与全球合作等四......
近日,记者从清华大学丘成桐数学科学中心获悉,该中心副教授周源与清华大学智能产业研究院、电子工程系副教授马剑竹合作,提出了一个可从观测数据中自动推导出空间物理规律的神经符号模型——PhyE2E(Phys......
关于发布新一代人工智能国家科技重大专项2025年度第一批项目申报指南的通知各有关单位:为加快实施新一代人工智能国家科技重大专项(以下简称“重大专项”),根据重大专项阶段性实施计划部署,现将2025年度......
2025年10月24日,由(国家级)天津经济技术开发区生物医药产教联合体,分析测试百科网(安特百科(北京)技术发展有限公司)联合主办的第三届天津生物及临床质谱论坛在天津圆满举办。此次论坛获得了多家单位......