去年,DeepMind公司开发的AlphaFold2人工智能系统,基于氨基酸序列,精确预测了蛋白质的3D结构。它的准确性与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。这一突破被誉为“变革生命科学和生物医学”的突破。
今日,DeepMind公司在《自然》杂志上发表论文,公开了进一步优化的AlphaFold2人工智能系统的源代码并且详细描述了它的设计框架和训练方法。同日,华盛顿大学(University of Washington)蛋白设计研究所David Baker教授课题组在《科学》杂志上发表论文,公布了其开源人工智能系统RoseTTAFold的研究结果。《自然》上发表的评论指出,这些论文和人工智能系统资源的发布,不但让基于DeepMind开发的AI系统预测蛋白质结构的技术能够为广大科学家和研究人员使用,而且有望进一步激发这一领域的进展。
蛋白质对生命来说不可或缺,它们支持生物体的几乎所有功能。这些复杂的大分子由氨基酸链构成,而蛋白质的功能很大程度上决定于它的3D结构。生物医学领域的众多挑战,包括开发治疗疾病的创新疗法,依赖于对蛋白质结构和功能的理解。
在过去的五十年中,科学家们已经能够利用冷冻电子显微镜、核磁共振或 X 射线晶体学等实验手段在实验室中确定蛋白质的形状,但每种方法都依赖于大量的试错,耗时耗力,可能需要花上好几年时间。1972年,诺贝尔化学奖得主Christian Anfinsen博士表示,理论上,蛋白质的氨基酸序列应该能够完全决定它的3D结构。这一假说激发了50年来基于氨基酸序列,通过计算方法预测蛋白质3D结构的探索。
在2018年,DeepMind开发的AlphaFold人工智能系统首次在国际蛋白质结构预测竞赛(CASP)上亮相。而在去年的CASP上,DeepMind的AlphaFold2系统表现惊艳,在接受检验的近100个蛋白靶点中,AlphaFold2对三分之二的蛋白靶点给出的预测结构与实验手段获得的结构相差无几。有些情况下,已经无法区分两者之间的区别是由于AlphaFold2的预测出现错误,还是实验手段产生的假象。
▲AlphaFold2根据氨基酸序列预测的蛋白结构与实验手段解析的结果几乎完全重合(绿色,实验结果;蓝色,计算预测结果;图片来源:DeepMind Blog)
DeepMind今日发布的更新版AlphaFold2在去年的系统基础上进行了优化,在解析蛋白结构的速度上有了进一步的提高。主要开发人员John Jumper博士说,这一系统的处理速度快了大约16倍。根据蛋白的大小,它可以在几分钟到几小时内生成准确的蛋白结构。
AlphaFold2系统去年在CASP上的出色表现促进了蛋白质3D结构预测领域其它团队的进步。华盛顿大学蛋白设计研究所David Baker教授的团队从AlphaFold2的设计思路中获得启发,构建了名为RoseTTAFold的软件系统。它的神经网络能够同时考虑蛋白序列的模式,蛋白中不同氨基酸之间的相互作用,以及蛋白质可能出现的3D结构。在这个系统中,一维、二维和三维的信息能够相互交流,让神经网络综合所有信息,决定蛋白质的化学组成部分和它折叠产生的结构之间的关系。

▲RoseTTAFold系统结构简介(图片来源:参考资料[3])
研究人员表示,RoseTTAFold系统在解析蛋白质3D结构方面的表现,与AlphaFold2的水平几乎相当,在有些蛋白上甚至优于AlphaFold2。
在论文中,研究人员指出,这一工具还可以用于预测由两个或者多个蛋白构成的复合体的构象。这让研究人员可以直接从蛋白序列,推测出不同蛋白相互结合的结构模型。在论文中,研究人员利用IL-12和IL-12受体(IL-12R)的序列预测的IL-12/IL-12R复合体结构与此前用冷冻电子显微镜解析的结构非常类似。

▲RoseTTAFold系统能够基于多个蛋白序列,预测复合体的结构(图片来源:参考资料[3])
Baker教授的团队已经将RoseTTAFold软件工具上传到GitHub网站上,7月份以来,它已经被世界上超过140个不同研究团队下载。
同时,该团队也搭建了服务器,让研究人员可以输入蛋白质序列,然后获得预测的蛋白结构。服务器在上个月启动后,已经帮助解析了大约500名用户递交的超过5000个蛋白结构。“我很高兴科学界已经在利用RoseTTAFold服务器来解决重要的生物学问题。” David Baker教授说。
“我们希望这一新工具将继续为整个研发团体造福。”论文的第一作者,Baker教授课题组的博士后Minkyung Baek说。
《自然》发表的新闻评论指出,随着RoseTTAFold和AlphaFold2源代码的公布,研究人员可以在两者的基础上继续前进,有望对人工智能系统做出进一步改进,攻克目前人工智能系统尚且无法确定构象的蛋白,以及使用这些软件设计全新的蛋白。
我们期待这一天的早日到来。
参考资料:
[1] DeepMind’s AI for protein structure is coming to the masses. Retrieved July 15, 2021, from https://www.nature.com/articles/d41586-021-01968-y
[2] Jumper et al., (2021). Highly accurate protein structure prediction with AlphaFold. Nature, https://doi.org/10.1038/s41586-021-03819-2.
[3] Baek, et al., (2021) Accurate prediction of protein structures and interactions using a three-track neural network. Science, https://doi.org/10.1126/science.abj8754.
[4] AlphaFold: a solution to a 50-year-old grand challenge in biology. Retrieved July 15, 2021, from https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
[5] Accurate protein structure prediction now accessible to all. Retrieved July 15, 2021, from https://www.eurekalert.org/pub_releases/2021-07/uows-aps070921.php
蛋白质工程基于蛋白质的灵活性,通过人工手段改变氨基酸序列,实现对蛋白质结构和功能的修饰和改造。与基因组工程相比,蛋白质工程可直接对蛋白质分子进行操纵,借助突变的迭代积累,快速完成蛋白功能优化和创新。蛋......
根据《工业和信息化部办公厅关于开展智能技术在生物制造领域典型应用案例征集工作的通知》(工信厅消费函〔2024〕394号),经省级工业和信息化主管部门推荐、形式审查及专家评价等程序,形成《人工智能在生物......
7月4日,在香港数码港举办的“人工智能资助计划”项目分享会上,人工智能资助计划委员会主席冼汉迪披露,截至6月底,香港特区政府拨款30亿港元的“人工智能资助计划”已批出10个项目,研究范围涵盖本地大语言......
德国亥姆霍兹慕尼黑研究中心开发出一款名为“半人马”(Centaur)的人工智能(AI)模型,能在几乎所有心理学实验中准确预测人类行为,甚至超越了科学家数十年来打造的传统认知模型,堪称“数字读心术”。这......
德国亥姆霍兹慕尼黑研究中心开发出一款名为“半人马”(Centaur)的人工智能(AI)模型,能在几乎所有心理学实验中准确预测人类行为,甚至超越了科学家数十年来打造的传统认知模型,堪称“数字读心术”。这......
6月30日发表于《自然-人类行为》的一项研究指出,人类倾向于拒绝来自人工智能(AI)对话机器人的情绪支持,除非这种同理心被误认为来自人类。生成式AI对话机器人,尤其是使用大语言模型(LLM)的对话机器......
6月30日发表于《自然-人类行为》的一项研究指出,人类倾向于拒绝来自人工智能(AI)对话机器人的情绪支持,除非这种同理心被误认为来自人类。生成式AI对话机器人,尤其是使用大语言模型(LLM)的对话机器......
7月2至3日,在北京举办的2025全球数字经济大会上,联合国工业发展组织投资和技术促进办公室联合东壁科技数据有限责任公司(以下简称东壁科技数据)发布了全球科技文献数据平台dbdata.com(以下简称......
7月3日,在2025全球数字经济大会人工智能融合应用发展论坛上,“杨梅工业”平台正式发布上线并宣布开源。“杨梅工业”平台是由北京工业软件产业创新中心自主研发、专注于工业智能体开发与部署的平台。该平台秉......
7月3日,在2025全球数字经济大会人工智能融合应用发展论坛上,“杨梅工业”平台正式发布上线并宣布开源。“杨梅工业”平台是由北京工业软件产业创新中心自主研发、专注于工业智能体开发与部署的平台。该平台秉......