发布时间:2024-09-12 10:44 原文链接: 学者发布无机材料AI模型,推理能力到达新高度

松山湖材料实验室研究员孟胜/刘淼团队在国家自然科学基金等项目的支持下,研发了一种基于深度学习图结构的通用预训练力场(graph-based pre-trained transformer force field,简称GPTFF)。相关成果近日发表于《科学通报(英文版)》(Science Bulletin)。

物质科学的核心问题之一是理解原子间的相互作用。如果我们能建立一个原子尺度的通用力场,便可创造一个原子间相互作用的求解器,从而通过分子动力学模拟诸多物质科学问题。科学家发明的量子化学/密度泛函理论通过求解薛定谔方程造就了一个模拟物质科学的大一统方法。通过此类方法,人们可以精确求解任意化合物体系中原子间相互作用,较为完美的解决了这个问题。但是密度泛函理论需要强大的算力,仅适用于数十至数百原子体系,无法线性扩展至大体系或复杂体系。而传统的分子动力学方法,虽然运算速度快,但是力场精度低、力场适用体系少,因此存在诸多限制。

为此,孟胜/刘淼团队研发了一种基于深度学习图结构的通用预训练力场GPTFF。该模型充分利用海量数据和transformer算法的注意力机制,具备出色的精度和泛化能力,可精确预测原子间相互作用,适用于几乎任意无机化合物的近平衡态,可用于大体系及复杂体系的分子动力学模拟。GPTFF模型支持开箱即用,用户可跳过模型训练步骤,直接开展化合物的结构优化、相变模拟、物质输运等科学问题。GPTFF开发团队已将该模型的算法、程序、模型参数开源,所有人都可下载使用。

据介绍,原子尺度的通用力场AI大模型,可广泛支持物质物理、材料、化学等诸多领域,它也被认为是物质科学的基座模型,有望变革性地改变物质领域的计算模拟方式。我国虽然有很多类似的项目及模型,但都采用欧美的开源数据集,无法从根本上实现自主可控,更无法实现超越。

GPTFF模型的训练数据源自自研的Atomly材料数据库(https://atomly.net/),包含近35万个无机材料数据,数据规模和质量位于世界顶级水准,知识产权自主可控,是我国唯一可对标欧美竞品的无机材料数据库。GPTFF的训练数据包含3780万个单点能量、117亿个力对和3.4亿个应力,数据具有高度的标准和一致性,保证了模型的高精度和强泛化能力。

此外,GPTFF能够实现对原子间相互作用的精确预测,原子间能量、受力以及应力的预测精度分别达到MAE=32meV/原子、71 meV/?和0.365 GPa,优于美国的同类AI模型(m3gnet和CHGNET)。可用于模拟晶体结构弛豫、固态电解质中的离子疏运、金属在应力下的相变等科学问题。

相关论文信息:https://doi.org/10.1016/j.scib.2024.08.039


相关文章

NASA和IBM联手打造可预测太阳耀斑的AI模型

近日,美国国家航空航天局(NASA)和IBM欧洲研究院合作,基于NASA卫星图像训练出一个人工智能(AI)模型,可预测未来几小时的太阳外观,甚至可以预测太阳耀斑的出现。“我更愿意把这个模型看作一架AI......

新AI模型可预测系列任务中人类的决定

近日,一项发表于《自然》的研究报道了创新人工智能(AI)系统——Centaur。它可以预测人们在各种情况下做出的决定,并且优于利用心理学经典理论所做的推测。不同于谷歌Deepmind的AlphaGo等......

上海交大团队将AI模型引入热辐射超材料设计

“我们引入AI(人工智能)模型,仅用3个月就可以筛选出5万多组数据,如果用常规方法,那么需要的时间难以估量。”上海交通大学材料科学与工程学院教授周涵3日在上海接受采访时说。北京时间7月2日深夜,上海交......

微软AI模型超越当前地球系统预报水平

美国微软公司开发了一个超越现有地球系统预报水平的AI模型。除了提供高分辨率的天气预报,这个名为Aurora的模型还有望更准确和高效地预报空气质量、热带气旋路径和海浪动力学。该成果5月21日发表于《自然......

科学家在AI模型中内置“防火墙”

人工智能(AI)正在迅速推进新型蛋白质的设计工作,这些蛋白质有望用作药物、疫苗及其他疗法。但这种希望也伴随着人们的担忧,同样的工具可能被用于设计生物武器或有害毒素的组成部件。如今,科学家提出了一系列可......

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......

深度思维AI模型表现超越现有天气预报

新一期《自然》杂志发表的一项研究报道了深度思维推出的最新机器学习模型。该模型能根据当前和未来天气进行可靠的概率天气预报,其表现不但超过了最好的传统中程天气预报,还能更好地预测极端天气、热带气旋路线和风......

AI模型10秒内检出脑肿瘤残留

美国密歇根大学和加利福尼亚大学旧金山分校领导的研究人员开发出一款名为FastGlioma的人工智能(AI)模型。在脑手术中,该模型仅用10秒就判断出是否还有残留的癌性肿瘤。在识别肿瘤残留方面,Fast......

AI模型“Evo”:揭开基因组“密码全书”新篇章

《科学》杂志15日发布了一项突破性研究成果:美国斯坦福大学Arc研究所团队利用人工智能(AI),开发出一种大规模基因组基础模型“Evo”,翻开了生命的“密码全书”。该模型采用先进架构,能够以前所未有的......