瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。
CARBonAra是在一个包含约370000个亚基的数据集上进行训练的。它还从蛋白质数据库中额外选取了100000个亚基用于验证,70000个亚基用于测试。
CARBonAra建立在该团队开发的蛋白质结构转换器框架的基础上。它使用了几何转换器,是一种深度学习模型,可以处理点之间的空间关系(如原子坐标),以学习和预测复杂的结构。该模型突出特点是“上下文”感知能力,这在提高序列恢复率方面尤为明显。
当CARBonAra包含分子“上下文”,如蛋白质与其他蛋白质、核酸、脂质或离子的界面时,其恢复率显著提高。
该模型不仅在合成基准测试中表现出色,还经过了实验验证,其灵活性和准确性为蛋白质工程开辟了新的途径,增强了未来药物发现的能力。CARBonAra在酶工程方面的成功也展示了其在工业应用中的潜力。
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来......
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来......
此前,对于帕金森的基础性研究已经发现,α-synuclein(α-突触核蛋白,αS)是一种与帕金森症发生密切相关的蛋白质。当该蛋白在神经细胞内错误折叠会形成路易小体,积累过剩容易损伤神经细胞。这次,来......
减数分裂过程中,配对的同源染色体间要形成拉链状的联会复合体。虽然联会复合体在结构上具有高度保守性,但其蛋白质序列的保守性却很低。目前已鉴定的联会复合体相关蛋白,在真菌、动物和植物之间几乎没有同源性。中......
摘要:本文介绍了蛋白质序列中可能存在的Zipf定律。......
摘要:为了研究蛋白质序列的内在特性,通过非线性预测方法将蛋白质序列和随机序列以及混沌序列进行比较。前期研究可知:每条蛋白质序列的每个特征序列的误差比值(E2D)图具有特异性,和随机序列的E2D图相比具......
摘要:利用相似规则、互补规则和分子识别理论建立一种氨基酸数字编码模型用于研究序列特征、功能预测。给出一种新的基于元胞自动机的蛋白质序列图像生成方法,其优点是考虑了氨基酸前后的相互作用,生成的图像与基因......
摘要:随着蛋白质序列-结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算......
摘要针对现有基于频繁模式的分类算法未考虑完全频繁模式所产生的大量无效序列,提出了一种基于最大频繁序列的蛋白质分类算法,此算法每一类都以独有的最大频繁式作为代表,执行模式裁减和测试数据分类实验表明该算法......
摘要:蛋白质序列的分类是预测新蛋白质序列的结构和功能的重要方法,已有的方法主要基于序列比对或概率后缀树。文章设计一种基于频繁模式的蛋白质序列分类算法CFS,使用每类数据独有的频繁模式代表该类,然后应用......