中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。相关成果7月21日发表于《自然—计算科学》。
近期有多项研究表明,用深度学习进行氨基酸序列设计,能在天然氨基酸残基类型恢复率等计算指标上超过能量函数方法。但目前已正式发表的工作中,对相关方法的实验验证结果远未达到能量函数方法的成功率。
据介绍,利用ABACUS-R进行序列设计的方法有两部分。第一部分是一个多任务预训练的编码—解码器网络,用于对单个氨基酸的结构和化学环境进行隐空间编码,再解码为包括中心残基氨基酸类型在内的多种真实特征;第二部分是把该编码解码网络迭代应用于目标主链的每个氨基酸残基,直到获得最大程度自洽的全序列。
在理论验证的基础上,团队尝试用实验表征了ABACUS-R对3个天然主链结构重新设计的57条序列,其中86%的序列可溶表达并能折叠为稳定单体。实验解析的5个高分辨晶体结构与目标结构高度一致。与此前报道的从头设计蛋白相似,ABACUS-R从头设计的蛋白表现出超高热稳定性,去折叠温度大多可达100℃以上。
总的来说,相较于ABACUS模型,ABACUS-R序列设计具有更高的成功率和结构精度,进一步增强了数据驱动蛋白质从头设计方法的实用性。ABACUS-R还可用于序列设计以外的其他任务。
阿尔法折叠3通过准确预测蛋白质、DNA的结构以及它们如何相互作用,改变对生物世界和药物发现的理解。图片来源:深度思维/IsomorphicLabs《自然》8日报道了结构生物学最新进展——阿尔法折叠3的......
基于RNA的治疗方法(包括mRNA疫苗),具有预防和治疗广泛疾病的巨大潜力。为了实现这一潜力,我们需要一套有效的递送载体,将治疗性RNA货物有效包装并安全地递送到特定的组织中。目前已经开发出多种递送方......
美国研究人员使用人工智能(AI)来设计超越自然界的新蛋白质。他们开发的机器学习算法,可生成具有特定结构特征的蛋白质,这些蛋白质可用于制造具有特定机械性能(如刚度或弹性)的材料,从而取代作为原料的石油或......
中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS......
中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS......
RNA病毒转录及基因组复制过程均不涉及DNA形式,需要由病毒自身编码的依赖RNA的RNA聚合酶(RNA-dependentRNApolymerase,RdRP)来主导完成。RdRP在特定位点精准而高效......
蛋白质是多肽链组成的三位结构,多肽链的氨基酸序列由DNA密码书写,编写多肽链的过程发生在核糖体,它们被称为蛋白质合成机器。根据遗传密码,来自DNA拷贝序列的信使RNA逐个聚合氨基酸分子,直到整条链的终......
斯坦福大学医学院的研究人员发现,哺乳动物大脑分泌的一种天然蛋白,具有类似安定(Valium)的作用,能够在癫痫发作时起到刹车作用。文章发表在Cell旗下的Neuron杂志上。研究人员将他们发现的蛋白称......
方便食品越来越受到人们的欢迎,食品包装也随之成为一个越来越重要的问题。传统的食品保鲜膜通常是由化石基聚合物制成的,近年来,研究者们一直在研究使用乳清蛋白替代传统的化石基聚合物制作食品保鲜膜。乳清里的天......
摘要经硫酸铵沉淀、超滤、阳离子交换分离和反相快速蛋白质液相色谱(FPLC)分析,得到了两种新的蚯蚓抗菌肽F21与F22,经电喷雾离子源质谱(ESI2MS)测定,其相对分子质量为535127和51912......