发布时间:2017-07-20 16:26 原文链接: 物理所等利用机器学习方法预测材料性能获进展

  近二十年来,机器学习方法的发展为我们的生活带来许多便利。智能网络搜索、语音识别,乃至无人超市、无人驾驶汽车等,依托于机器学习方法的新事物正迅速地在生活中普及。Alpha Go的横空出世更让世界惊叹于人工智能的潜在价值。在科研领域,大数据的理念正在改变着科研人员对未知世界的探索方式。美国在2011年提出了材料基因组计划(Materials Genome Initiative),以期加快材料的研发过程。我国怀柔科学城的发展规划中,“材料基因组研究平台”项目已全面开工建设。高通量实验+高性能计算+深度数据分析的研究方式已经成为时代发展的趋势。

  在非晶合金研究领域,如何设计并开发出具有良好玻璃形成能力的合金,是一个具有重要产业价值的科学问题。过去非晶合金材料新体系的探索主要依据经验性判据的指导,由于其准确性与通用性的限制,非晶新材料的研发速度非常缓慢。如何提高材料设计的效率,寻找具有更优性能的材料,是非晶材料领域非常具有挑战性的问题。

  最近,中国科学院物理研究所/北京凝聚态物理国家实验室(筹)汪卫华研究组博士研究生孙奕韬在研究员汪卫华、白海洋及中国人民大学物理系教授李茂枝的指导下,使用机器学习的方法,对二元合金的玻璃形成能力进行了系统分析,建立了合金成分与性能之间的关联,并对可能的新材料进行了预测。研究过程中使用了支持向量机(Support Vector Machine)这种方法(图1),通过构建多维空间,并在这个多维空间内对数据进行分割,从而建立输入参量与输出参量之间的关联。该研究方法可通过不断选择新的参数对模型进行重复训练,探讨了合金的不同性质对其玻璃形成能力的影响(图2)。研究发现,参量Tliq(表征合金过冷能力的参量)与合金的玻璃形成能力有最为显著的关联,而且使用参量Tliq与Tfic(表征合金热稳定性)作为输入参数,可以得到具有最佳预测效率的模型。通过对最佳模型的分析,发现已知的具有良好玻璃形成能力的二元合金,其分布与模型的预测值具有很好的一致性(图3)。使用这个模型,可以对未知的合金成分进行预测,这样由深度数据分析指导设计的实验,可以极大地缩短非晶合金材料的研发周期(图4)。该工作作为使用新的工具对经典问题进行分析的一种尝试,得到了初步成果。这表明,机器学习的方法在非晶材料设计与研发领域具有重要的应用前景。采用更全面、完善的数据库,运用更深入的人工智能算法,机器学习方法能够为非晶等领域科研人员提供更精准的信息,进一步加速材料的研发过程。

  这项研究结果最近发表在J. Phys. Chem. Lett. 8, 3434(2017)上。该项研究工作得到国家自然科学基金项目(51571209,51461165101)、科技部“973”项目(2015CB856800)和中科院前沿科学关键研究项目(QYZDY-SSW-JSC017)的支持。

图1. 支持向量机方法的基本过程,包括四个主要部分:数据库的建立,模型的训练,模型的评估,以及最优模型的预测。

图2. 不同的输入参数得到的模型的预测结果。

图3. 最优模型的预测结果。已发现的优秀材料与模型预测(红色区域)有很好的一致性。

图4. 最优模型预测得到最佳玻璃形成能力的合金体系的成分云图。


相关文章

因美纳推出5碱基解决方案以驱动多组学发现,开启基因组与表观基因组的同步洞察

• 在美国人类遗传学会(ASHG)年会上,因美纳5碱基解决方案的早期试用客户——伦敦健康科学中心研究所将展示该技术在加速罕见病病例解析方面的强大潜力。• 因美纳专有的5碱基化学技术......

许瑞明研究组合作揭示人逆转座子LINE1靶向整合基因组的重要机制

人类基因组中存在大量具有"跳跃"能力的逆转座子(retrotransposon)序列。在胚胎发育早期、免疫和神经系统等特定阶段和环境下,它们会被激活,发挥重要生理功能;在病毒感染、......

高精度完整基因组助橡胶育种驶入“快车道”

橡胶树是天然橡胶的主要来源。“橡胶树育种面临的主要困难在于周期长和效率低,通过常规育种方法将多抗、高产性状聚合往往需要30~40年。”中国热带农业科学院橡胶研究所研究员程汉告诉《中国科学报》。然而,目......

小麦野生近缘种基因组“密码”被破解

记者宋喜群、冯帆从山东农业大学获悉,该校农学院教授孔令让研究团队首次组装了小麦远缘杂交常用物种中间偃麦草和鹅观草染色体水平的高质量基因组序列,解析了二者基因组结构差异与独立多倍化演化路径,对两者携带的......

烟草分枝发育的“开关基因”被发现

近日,中国农业科学院烟草研究所烟草功能基因组创新团队发现烟草分枝发育“开关基因”,预示着未来作物株型调控有了新靶点。相关研究成果发表在《植物生物技术》(PlantBiotechnologyJourna......

新研究破译薇甘菊入侵基因密码

薇甘菊作为全球十大最具危害的恶性入侵杂草之一,以其惊人的繁殖速度和强大的环境适应性,在亚洲、太平洋地区及中国华南地区造成严重生态破坏。然而,其基因组层面的适应性进化机制长期未被系统解析,制约了科学防控......

研究开发出酵母泛基因组数字模型与代谢网络分析方法

近日,中国科学院大连化学物理研究所研究员周雍进团队与上海交通大学副教授鲁洪中合作,在酵母系统生物学研究中取得新进展。研究团队通过整合分析全球1807株酿酒酵母菌株的基因组与生态位数据,构建了高覆盖度的......

基因组大数据还原野猪横跨欧亚的百万年迁徙历程

近日,中国农业科学院农业基因组研究所农业基因编辑技术创新团队深入解析了中亚野猪种群在跨越欧亚大陆百万年的迁徙历程中适应环境的独特遗传密码,为理解大型哺乳动物如何应对环境变化提供了全新视角。相关研究成果......

基因组密码被解锁:深度学习模型破解非编码区奥秘

人类基因组中超98%的遗传变异位于非编码区,这些变异通过调控染色质可及性、三维构象、剪接加工等多种分子机制影响基因表达,最终导致疾病发生。由于调控机制的复杂性和细胞类型特异性,目前解读非编码变异的分子......

“女娲”基因组计划发布第八项成果

近日,中国科学院生物物理研究所徐涛研究组和何顺民研究组在《基因组、蛋白质组与生物信息学报》杂志发表论文。两位科学家牵头的“女娲”中国人群基因组计划旨在构建中国人群的全基因组数据资源,支撑中国人群的疾病......