发布时间:2022-07-22 08:03 原文链接: 深度学习实现蛋白质序列高成功率从头设计

  中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。研究成果北京时间7月21日发表于《自然-计算科学》。

500.png

一个来自天然蛋白的目标结构(天蓝色)与相应从头设计蛋白的晶体结构(绿色)叠合图 课题组供图

  刘海燕、陈泉团队长期致力于发展数据驱动的蛋白质设计方法,先后建立并实验验证了对给定主链结构设计氨基酸序列的统计能量函数ABACUS模型,以及利用神经网络能量函数从头设计主链结构的SCUBA模型。然而,基于传统统计能量技术的ABACUS模型在成功率、计算效率等方面仍有不足。

  近期有多项研究表明,用深度学习进行氨基酸序列设计,能够在天然氨基酸残基类型恢复率等计算指标上超过能量函数方法。但截至目前已正式发表的工作中,对相关方法的实验验证结果远未达到能量函数方法的成功率。

  刘海燕介绍,利用ABACUS-R进行序列设计的方法由两部分组成。

  第一部分是一个多任务预训练的编码-解码器网络,用于对单个氨基酸的结构和化学环境进行隐空间编码,再解码为包括中心残基氨基酸类型在内的多种真实特征;第二部分是把该编码解码网络迭代应用于目标主链的每个氨基酸残基,直到获得最大程度自洽的全序列。

  在理论验证的基础上,团队尝试用实验表征了ABACUS-R对3个天然主链结构重新设计的57条序列,其中86%的序列(49条)可溶表达并能折叠为稳定单体。实验解析的5个高分辨晶体结构与目标结构高度一致。此外,与此前报道的从头设计蛋白相似,ABACUS-R从头设计的蛋白表现出超高热稳定性,去折叠温度大多可达100℃以上。

  总的来说,相较于ABACUS模型,ABACUS-R序列设计更高的成功率和结构精度进一步增强了数据驱动蛋白质从头设计方法的实用性。ABACUS-R还提供了一种对蛋白质局部结构信息的预训练表示方式,可用于序列设计以外的其他任务。

  审稿人认为,该研究“最新颖的贡献在于对设计的充分实验表征,包括晶体结构,以及可溶表达的高成功率。”

相关文章

Nature发布2024年值得关注的七大技术,首位中国科学家成果入选

2024年1月22日,《自然》发布了2024年值得关注的七大技术——大片段DNA插入、人工智能设计蛋白质、脑机接口、细胞图谱、超高分辨率显微成像、3D打印纳米材料和DeepFake检测。七大技术中,生......

安捷伦推出全新ProteoAnalyzer系统

自动化平行毛细管电泳系统可简化蛋白质分析2024年1月17日,北京——安捷伦科技公司(纽约证交所:A)今日宣布在第23届PepTalk会议期间正式发布用于蛋白质分析的新型自动化平行毛细管电泳系统——A......

机器人改造蛋白质速度超过人类

美国科学家开发了一个能对蛋白质进行工程改造的人工智能(AI)驱动的全自动机器人。研究结果是对无需人类干预的蛋白质设计和构建的一次概念验证。相关研究1月12日发表于《自然—化学工程》创刊号。蛋白质在所有......

支架蛋白CRIP1参与蛋白质稳态调控机制被阐明

近日,中国医学科学院血液病医院(中国医学科学院血液学研究所)郝牧研究员、邱录贵主任医师团队在eBioMedicine杂志发表论文,在国际上首次阐明了支架蛋白CRIP1参与自噬、蛋白酶体活性等蛋白质稳态......

几周内或能完成半年任务?AI无需人干预设计新蛋白质

《自然·化学工程》创刊号1月12日发表一项研究,报道了一个能对蛋白质进行工程改造的、由人工智能(AI)驱动的全自动机器人。研究结果是对无需人类干预的蛋白质设计和构建的一次概念验证。蛋白质在所有生命形式......

我国学者首次利用AI方法准确模拟蛋白质“光学指纹”

安徽大学人工智能学院叶盛教授、孙长银教授与中国科学技术大学江俊教授等合作,在国际上首次成功利用人工智能、分子动力学模拟和量子化学理论计算方法,高效准确地模拟了完整真实蛋白质的AmideⅡ区域红外光谱,......

蛋白质研究加码!山东大学采购蛋白质印迹定量分析系统

山东大学近日招标了多功能全自动蛋白质印迹定量分析系统,这款设备在蛋白样品上样后无需任何人工操作,能够自动完成WesternBlot分析,并且具有运行时间短,无需转膜等优点。项目概况山东大学多功能全自动......

mRNA疫苗可能会产生意想不到的蛋白质

即使在新冠疫情期间接种了数十亿剂疫苗后,信使核糖核酸(mRNA)疫苗仍令人惊讶。近日,《自然》发表的一项研究表明,mRNA疫苗可能会促使细胞产生少量意想不到的蛋白质。研究人员提出一种解决方案,有助于使......

AI设计高亲和力和特异性蛋白质结合剂:医学革命的崭露头角

AI设计与蛋白质高亲和力和特异性结合的分子2023年12月18日华盛顿大学医学院蛋白质设计研究所的AI设计的蛋白质。[IanHaydon/UWMedicineInstituteforProteinDe......

活体器官年龄测定现实可能性,血液中的蛋白质成为关键指标

导读:实现了从血浆蛋白质组学分析中挑选出的器官特异性衰老标志物 新研究在血浆中发现了器官特异性的衰老标志物,可以突显个体在一个或多个器官中的衰老速度超过正常。"我们的研究引入了使用......