基于 Transformer 的大语言模型(LLM)在自然语言处理、生物、化学和计算机编程等各个领域取得了重大进展。
但对于在实验室工作的研究人员或那些不熟悉计算机代码的人来说,人工智能方法并不那么容易理解。
近日,卡内基梅隆大学的研究团队找到了如何让人工智能系统自学化学的方法。提出了一种基于 GPT-4 的智能 Agent(以下简称 Coscientist),用一个简单的语言提示就可以执行整个实验过程。能够自主设计、规划和执行复杂的科学实验。
Coscientist 可以设计、编码和执行多种反应,在湿实验中使用其机器人设备制造包括扑热息痛和阿司匹林在内的化合物。
比如,科学家可以要求 Coscientist 找到具有给定性质的化合物。该系统搜索互联网、文档数据和其他可用资源,综合信息并选择使用机器人应用程序编程接口(API)的实验过程。然后将实验计划发送给自动化仪器并由其完成。总之,与系统一起工作的人可以比单独工作的人更快、更准确、更有效地设计和运行实验。
领导该研究的卡内基梅隆大学的化学家 Gabe Gomes 表示:「当我看到非有机智能能够自主计划、设计和执行人类发明的化学反应时,真是太棒了。那真是一个 holy crap 的时刻。」
研究人员表示:「我们预计,用于自主科学实验的智能代理系统将带来巨大的发现、不可预见的疗法和新材料。虽然我们无法预测这些发现会是什么,但我们希望看到一种新的方式,通过人与机器之间的协同合作来进行研究。」
该研究以《Autonomous chemical research with large language models》为题,于 2023 年 12 月 20 日发表在《Nature》上。
论文链接:https://www.nature.com/articles/s41586-023-06792-0
AI 的快速进步使得这些工具的应用在整个科学领域激增。但对于在实验室工作的研究人员或那些不熟悉计算机代码的人来说,人工智能方法并不那么容易理解——至少 Gomes 是这么认为的。
当 ChatGPT 背后的大语言模型 (LLM) 的最新版本(GPT-4)于 3 月份推出时,Gomes 和他的团队开始着手让它为化学家服务。
研究人员表示,该研究使用的所有 AI 系统都是 LLM,主要是 GPT-3.5 和 GPT-4,尽管其他一些系统(Claude 1.3 和 Falcon-40B-Instruct)也进行了测试。GPT-4 和 Claude 1.3 表现最好。但是,研究人员并没有使用单一系统来处理化学的各个方面,而是设置了不同的实例以分工设置进行合作,并将其称为「Coscientist」。
结果,Coscientist 使用最新的强大的 LLM(包括 GPT-4)来搜索化学文献,并设计一条反应途径,在人类的提示下制造分子。LLM 阅读互联网上的说明手册,并决定其库中最好的试剂盒和试剂,以在现实生活中制造该分子。
Coscientist 加速六种不同任务研究
Coscientist 展示了其加速六种不同任务研究的潜力,包括钯催化交叉偶联的成功反应优化,同时展示了(半)自主实验设计和执行的先进能力。研究结果证明了像 Coscientist 这样的 AI 系统在推进研究方面的多功能性、有效性和可解释性。
Coscientist 可以使用工具浏览互联网和相关文档、使用机器人实验应用程序编程接口 (API) 并利用其他 LLM 来完成各种任务。
图示:Coscientist 系统架构。(来源:论文)
研究人员在六项任务中展示了 Coscientist 的多功能性和性能:
(1)使用公开数据规划已知化合物的化学合成;
(2)有效地搜索和浏览大量的硬件文档;
(3)使用文档在云实验室中执行高级命令;
(4)用低级指令精确控制液体处理仪器;
(5)解决需要同时使用多个硬件模块和集成不同数据源的复杂科学任务;
(6)解决分析先前收集的实验数据的优化问题。
设计、编码、合成
该团队促使系统计划合成几种已知分子,包括止痛药扑热息痛和阿司匹林,以及有机分子硝基苯胺和酚酞。在规划阶段,Coscientist 能够制定出总体上能获得最佳反应产率的步骤。并正确地制造了分子。
为了演示网络搜索器模块的功能之一,研究设计了一个由七种要合成的化合物组成的测试集。
图示:Coscientist 在化学合成计划任务中的能力。(来源:论文)
基于 GPT-4 的 Web 搜索器显著改进了合成规划。对乙酰氨基酚、阿司匹林、硝基苯胺和酚酞的所有试验均达到最高分。
评估智能体推理能力的可能策略之一是测试它是否可以使用之前收集的数据来指导未来的行动。在此,研究人员重点关注 Pd 催化转化的多变量设计和优化,展示了 Coscientist 处理涉及数千个示例的现实实验活动的能力。研究目标是直接使用 Coscientist。
将 Coscientist 的化学推理能力测试设计为游戏,目标是最大化反应产率。使用标准化优势指标来评估 Coscientist 的表现。
图示:优化实验结果。(来源:论文)
标准化优势值随着时间的推移而增加,这表明该模型可以有效地重用获得的信息,以提供有关反应性的更具体的指导。
LLM 潜力巨大,但也要考虑风险
英国格拉斯哥大学(University of Glasgow)化学家 Lee Cronin 表示:「这很好地展示了如何使用 LLM 来探索文献,帮助提出可行的化学反应的想法。」
葡萄牙里斯本大学(University of Lisbon)药物化学家 Tiago Rodrigues 表示,「像 Coscientist 这样的工具可能会被更广泛地使用。我确实可以预见自动化硬件配备这些人工智能助手的未来。自动驾驶实验室是未来,需要人工智能工具来完全自动化设计-制造测试循环。」
现在这些系统可以完成日常任务,但 Rodrigues 补充说,大多数研究问题,特别是在药物发现方面,仍然遥不可及。「不仅需要对化学有很好的理解,还需要对生物学有很好的理解。」
「科学家可以做训练有素的化学家可以做的大部分事情。我经常思考这个问题,」Gomes 说。他的团队尚未免费提供其发明背后的完整代码,Gomes 表示,仔细考虑如何以及在哪里使用 Coscientist 和 ChemCrow 等技术是很重要的,因为某些应用程序可能存在危险。
参考内容:
https://arstechnica.com/science/2023/12/large-language-models-can-figure-out-how-to-do-chemistry/
https://www.nature.com/articles/d41586-023-03790-0
https://www.nature.com/articles/d41586-023-04073-4
https://techxplore.com/news/2023-12-artificially-intelligent-coscientist-automates-scientific.html
《自然》网站在近日的报道中指出,由人工智能(AI)加持的致命自主武器已经到来,AI可能会帮助它们攻击特定目标。研究人员、法律专家和伦理学家正努力解决如何在战场上使用这些武器的问题。2023年7月,联合......
【作者按】随着通用人工智能(AGI)时代的来临,人工智能技术的快速发展和广泛应用将给人类社会带来深刻影响。一方面,AGI将无所不在,渗透到人类生活和生产的各个领域,有望成为推动社会进步的先进生产力。但......
中新网北京4月29日电(谢雁冰)北京外国语大学与社会科学文献出版社29日共同发布《英国蓝皮书:英国发展报告(2022~2023)》(以下简称“蓝皮书”)。蓝皮书指出,2022年至2023年度,英国大学......
随着人工智能技术的兴起,智慧医疗有了更多想象空间。去年年中,位于苏州的一家年轻生物医药科技企业——英矽智能宣布,全球首款AI药物完成Ⅱ期临床试验首例患者给药。而在今年4月18日,恒瑞医药发布的2023......
文|《中国科学报》记者赵广立不得了,沉睡两千多年的秦陵兵马俑居然“唱”起秦腔来了!在类似的几段视频中,兵马俑不仅能开口唱歌,就连面部表情也惟妙惟肖;仔细看,还能看到他的喉结在动、胸腔共鸣……不仅有兵马......
4月28日,崖州湾国家实验室精准设计与智造团队与中国农业大学、上海人工智能实验室共同发布首个种业大语言模型“丰登”。该模型集成了先进的人工智能技术与大数据分析,对海量来自不同渠道的育种科研文献、技术书......
人夺天工智赋新能努力开创人类更加美好的未来在清华大学人工智能学院成立大会上的讲话清华大学党委书记邱勇春和景明,辉光日新。在这个美好的、充满无限希望的日子里,我们迎来了清华大学113周年校庆。今天,我们......
4月27日,在清华大学113周年校庆到来之际,清华大学成立人工智能学院,聚焦“人工智能核心基础理论与架构”和“人工智能+X”两个重点方向,以高定位和新机制建设中国自主的“AI顶尖人才和原始创新基座”,......
4月25日,人工智能驱动的工业超声检测联合实验室在全球知识产权保护与创新论坛上揭牌,该实验室由北京工业大学、北京知识产权运营管理公司(以下简称“北京IP”)、北京拓灵新声科技有限公司(以下简称拓灵新声......
中国信息通信研究院(简称“中国信通院”)今天(28日)发布了国内首个汽车大模型标准。标准主要涵盖三个能力域,其中场景丰富度侧重评估汽车大模型对智能座舱和自动驾驶等细分场景的支持情况,能力支持度重点关注......