发布时间:2024-09-24 17:46 原文链接: 新AI模型可大幅提高化合物蛋白质相互作用预测可靠性

中国科学院上海药物研究所研究员郑明月,副研究员张素林、李叙潼,提出了基于知识图谱的人工智能计算模型PertKGE,并以数据驱动的形式从微扰转录组数据中解耦出化合物-蛋白质相互作用(CPI)。9月19日,相关研究发表于《细胞基因组学》。

对化合物和蛋白质之间的相互作用进行建模,是药物发现的基础。目前,研究人员可以利用不同的生物数据,从多种研究视角构建化合物-蛋白质相互作图谱。其中,微扰转录组学联系起了化合物和组学数据之间的联系,提供了化合物微扰受试体(单细胞、细胞系、病人)后产生的直观微扰结果,为解耦CPI提供了全新的视角。然而,CPI通常不会直接反应在差异表达基因上,为微扰转录组数据的分析带来了挑战。

基于微扰组学分析中的因果推断模型以及知识图谱在药物发现中的广泛应用,研究人员提出了PertKGE模型,从因果视角构建新型的生物知识图谱。模型包含原因(化合物与受试体中的特定靶标发生CPI)、过程(生物系统中多层级的调控事件对CPI信号进行放大)、结果(微扰结果以差异表达基因的形式被观测)这3个组成部分。

在此基础上,研究人员结合知识图谱嵌入技术建模因果链接,从差异表达基因中解耦CPI。广泛的计算实验表明,PertKGE在化合物和靶标的冷启动场景中均取得了最好的CPI预测性能,并且缓解了CPI数据集中代表性偏差对模型学习的影响,从而大幅提高了预测的可靠性。

进一步地,研究团队将PertKGE分别整合进基于表型靶标的药物发现流程中,发现了TNKS抑制剂K-756的新靶标胞外核苷酸焦磷酸酶/磷酸二酯酶1(ENPP1),为其独特的抗肿瘤免疫效应提供了分子层面的机制解释。此外,研究团队以10.8%的高命中率,为治疗结直肠癌和胰腺癌的新型靶标人醛脱氢酶1家族成员B1(ALDH1B1)筛选到了5个具有全新骨架的苗头化合物。

研究团队介绍,将CPI预测任务对应到药物发现的真实场景中,计算模拟和实验验证均证明了PertKGE在药物发现流程中的作用,为CPI图谱的构建和推理提供了一种全新的策略。

相关论文信息:https://doi.org/10.1016/j.xgen.2024.100655


相关文章

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......

合成数据能否让AI模型精确可靠?

人工智能(AI)初创公司xAI创始人埃隆·马斯克近日表示:“在AI训练中,我们现在基本上耗尽了人类知识的累积总和。”之前研究也表明,人类生成的真实数据将在2到8年内消耗殆尽。鉴于真实数据日益稀缺,为满......

深度思维AI模型表现超越现有天气预报

新一期《自然》杂志发表的一项研究报道了深度思维推出的最新机器学习模型。该模型能根据当前和未来天气进行可靠的概率天气预报,其表现不但超过了最好的传统中程天气预报,还能更好地预测极端天气、热带气旋路线和风......

AI模型10秒内检出脑肿瘤残留

美国密歇根大学和加利福尼亚大学旧金山分校领导的研究人员开发出一款名为FastGlioma的人工智能(AI)模型。在脑手术中,该模型仅用10秒就判断出是否还有残留的癌性肿瘤。在识别肿瘤残留方面,Fast......

AI模型“Evo”:揭开基因组“密码全书”新篇章

《科学》杂志15日发布了一项突破性研究成果:美国斯坦福大学Arc研究所团队利用人工智能(AI),开发出一种大规模基因组基础模型“Evo”,翻开了生命的“密码全书”。该模型采用先进架构,能够以前所未有的......

百图生科:融资超14亿元、订单超142亿元,下一步要做生命科学AI模型提供商

百图生科联合创始人、CEO刘维2024年诺贝尔化学奖颁给谷歌DeepMind丹米斯·哈萨比斯(DemisHassabis)和约翰·乔普(JohnM.Jumper),表彰AI大模型实现蛋白质结构预测,从......

新AI模型可大幅提高化合物蛋白质相互作用预测可靠性

中国科学院上海药物研究所研究员郑明月,副研究员张素林、李叙潼,提出了基于知识图谱的人工智能计算模型PertKGE,并以数据驱动的形式从微扰转录组数据中解耦出化合物-蛋白质相互作用(CPI)。9月19日......

OpenAI推出具备推理能力新AI模型

据ChatGPT制造者美国开放人工智能公司(OpenAI)官网12日报道,该公司已经成功研发出一系列具备推理能力的人工智能(AI)模型,并命名为“OpenAIo1”。这些模型的独特之处在于,其会花更长......

学者发布无机材料AI模型,推理能力到达新高度

松山湖材料实验室研究员孟胜/刘淼团队在国家自然科学基金等项目的支持下,研发了一种基于深度学习图结构的通用预训练力场(graph-basedpre-trainedtransformerforcefiel......

预测蛋白质序列的新AI模型问世

使用CARBonAra进行序列预测(示意图)。图片来源:瑞士洛桑联邦理工学院科技日报北京8月8日电(记者张佳欣)瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模......