发布时间:2022-07-22 08:03 原文链接: 深度学习实现蛋白质序列高成功率从头设计

  中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。研究成果北京时间7月21日发表于《自然-计算科学》。

500.png

一个来自天然蛋白的目标结构(天蓝色)与相应从头设计蛋白的晶体结构(绿色)叠合图 课题组供图

  刘海燕、陈泉团队长期致力于发展数据驱动的蛋白质设计方法,先后建立并实验验证了对给定主链结构设计氨基酸序列的统计能量函数ABACUS模型,以及利用神经网络能量函数从头设计主链结构的SCUBA模型。然而,基于传统统计能量技术的ABACUS模型在成功率、计算效率等方面仍有不足。

  近期有多项研究表明,用深度学习进行氨基酸序列设计,能够在天然氨基酸残基类型恢复率等计算指标上超过能量函数方法。但截至目前已正式发表的工作中,对相关方法的实验验证结果远未达到能量函数方法的成功率。

  刘海燕介绍,利用ABACUS-R进行序列设计的方法由两部分组成。

  第一部分是一个多任务预训练的编码-解码器网络,用于对单个氨基酸的结构和化学环境进行隐空间编码,再解码为包括中心残基氨基酸类型在内的多种真实特征;第二部分是把该编码解码网络迭代应用于目标主链的每个氨基酸残基,直到获得最大程度自洽的全序列。

  在理论验证的基础上,团队尝试用实验表征了ABACUS-R对3个天然主链结构重新设计的57条序列,其中86%的序列(49条)可溶表达并能折叠为稳定单体。实验解析的5个高分辨晶体结构与目标结构高度一致。此外,与此前报道的从头设计蛋白相似,ABACUS-R从头设计的蛋白表现出超高热稳定性,去折叠温度大多可达100℃以上。

  总的来说,相较于ABACUS模型,ABACUS-R序列设计更高的成功率和结构精度进一步增强了数据驱动蛋白质从头设计方法的实用性。ABACUS-R还提供了一种对蛋白质局部结构信息的预训练表示方式,可用于序列设计以外的其他任务。

  审稿人认为,该研究“最新颖的贡献在于对设计的充分实验表征,包括晶体结构,以及可溶表达的高成功率。”

相关文章

植物减数分裂过程中染色体精准分离调控获揭示

近日,华南农业大学教授王应祥团队在国家自然科学基金等项目的资助下,研究揭示了模式植物拟南芥泛素连接酶后期促进复合物/细胞周期体(APC/C)调控减数分裂染色体正确分离的分子机制。该研究丰富了蛋白质泛素......

科学团队创制荧光探针实现蛋白质成簇/解聚活细胞监测

华东理工大学化学与分子工程学院、费林加诺贝尔奖科学家联合研究中心教授郭志前团队,创制了激活型化学遗传学荧光探针,首次在活细胞中监测蛋白质成簇/解聚的精确状态。相关研究近日作为VIP(VeryImpor......

mRNA“戴帽”后能多产两百倍蛋白质

日本名古屋大学研究团队在最新一期《自然·生物技术》杂志上发表了一项名为“内部帽启动翻译”(ICIT)机制的创新研究。该机制下的仿佛戴着帽子的mRNA可产生200倍以上的蛋白质,为治疗癌症和蛋白质合成异......

科学家从蛋白质动态层面解答早期胚胎发育失败原因

中国科学院脑科学与智能技术卓越创新中心/上海脑科学与类脑研究中心研究员刘真、孙怡迪,博士后朱文成团队,与复旦大学附属中山医院生殖医学中心主治医师木良善团队、上海交通大学医学院研究员李辰团队合作,描绘了......

我国学者在蛋白质酪氨酸泛素化方面取得进展

图FUSEP化学生物学技术用于系统研究赖氨酸和非赖氨酸泛素化的位点信息在国家自然科学基金项目(22137004、22307062)资助下,清华大学药学院尹航教授团队在蛋白质泛素化研究领域取得新进展,开......

中国科协青托工程专项计划首批托举3000余名博士生

1月5日,记者从中国科协获悉,中国科协青年人才托举工程博士生专项计划首批入选3226人,他们将在拓宽学术视野、增强学术锻炼、加快学术成长等方面获得专项培养,托举期为2025年1月至2026年12月。中......

专家学者盘点近两年AI发展——加速应用落地变革科研范式

当前人工智能技术和产业有哪些热点?我国人工智能产业发展呈现怎样的特点?12月12日举行的中国科学院人工智能产学研创新联盟2024年会,为这些问题提供了答案。本次年会以“人工智能助力科研范式变革(AIf......

植入式传感器可持续监测炎症水平

受大自然启发,美国西北大学生物工程师团队开发出一种植入皮下的传感器,可实时跟踪活体动物蛋白质水平的波动,测量炎症标志物的变化。相关论文发表在《科学》杂志上,标志着医学检测领域的一个重要里程碑。为了检测......

热烈祝贺黄超兰教授荣获“ClinicalandTranslationalProteomicsAward”

北京时间10月23日,在德国德雷斯顿举行的2024HUPO大会颁奖典礼上,备受瞩目的“ClinicalandTranslationalProteomicsAward”(临床转化蛋白质组学奖)荣耀加冕于......

创新计算框架在蛋白质设计方面获突破

在今年诺贝尔化学奖表彰计算蛋白质设计领域的重大进展后,美国能源部阿贡国家实验室团队宣布开发出一种名为MProt-DPO的创新计算框架,该框架利用人工智能(AI)和世界顶尖的超级计算机,推动蛋白质设计取......