发布时间:2022-07-29 09:00 原文链接: 谷歌DeepMind:已发现科学界几乎所有已知的蛋白质结构

“从今天起,预测几乎所有已知蛋白质的结构,都如同使用搜索引擎一样简单。”

7月28日,DeepMind公司与欧洲生物信息研究所(EMBL-EBI)的合作团队公布了生物学领域的一项重大飞跃。他们利用人工智能(AI)系统AlphaFold预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质。这一突破将加速新药开发,并为基础科学带来全新革命。

▲AlphaFold能够预测出几乎所有已知蛋白质的结构(图片来源:DeepMind;参考资料[1])

2020年年底,当人们对AlphaFold的印象还停留在那个打败全人类的围棋高手时,这个AI系统在生物学领域的亮相带来了新的惊喜。当时,AlphaFold成功破解了生物学持续50年的重大难题——蛋白质折叠问题,能够根据蛋白质的氨基酸序列预测蛋白质的三维结构。

仅仅半年后,DeepMind和EMBL-EBI合作,在一篇《自然》论文中发布了由AlphaFold预测的蛋白结构数据库。这个数据库涵盖了人类和20种常用模式生物的35万个蛋白质结构,并且对98.5%的人类蛋白质结构进行了准确预测——要知道在此之前,科学界解析的蛋白质结构只覆盖了人类蛋白序列17%的氨基酸。人工智能预测蛋白质结构领域的一系列突破,也被《科学》评选为2021年的年度科学突破

现在,DeepMind与EMBL-EBI的合作团队更进一步。AlphaFold对蛋白质结构的预测不再局限于人类与模式生物,而是拓展至涵盖了动植物、细菌等的100万个物种,预测的蛋白质结构数量也提升了数百倍。

image.png

▲AlphaFold预测的蛋白质结构,涵盖了大量动植物及微生物物种(图片来源:DeepMind;参考资料[1])

这个数据库涵盖了整个蛋白质宇宙,我们迈入了数字生物学的全新时代。”DeepMind的CEO Demis Hassabis博士点评道。

早在1972年,诺贝尔化学奖得主Christian Anfinsen博士就在诺奖颁奖典礼上提出,蛋白质的氨基酸结构应该能完全决定其三维结构。但由于氨基酸可能形成的蛋白质构象是个天文数字,通过计算预测蛋白质结构难度极高。而利用传统的实验手段(例如X射线晶体学)解决该问题,时间消耗以及价格都十分惊人。
对于今日公布的全新数据,DeepMind与EMBL-EBI团队表示,在超过2亿个蛋白质结构预测中,大约35%的结构具有高精度,达到了实验手段获取的结构精度;80%的结构可靠性足以用于多项后续分析。

image.png

▲在此前发表的研究中,AlphaFold预测的部分蛋白质结构(图片来源:DeepMind;参考资料[1])

不过,目前的AlphaFold仍有提升的空间。伦敦大学学院的Tomek Wlodarski 博士提出,如何开发模型来预测蛋白质如何折叠,而不仅是预测最终的结构,是研究团队接下来要解决的问题。

DeepMind的科学团队主管Pushmeet Kohli博士也指出,现阶段他们正在提升AlphaFold的准确性与性能:“我们试图理解这些蛋白质的行为、它们如何与其他蛋白质互作。”
一年前的《自然》论文发表时,研究团队就向科研人员免费公开了AlphaFold的源代码以及数据库。目前,已有来自190个国家和地区的50多万位学者访问数据库。这些数据已经在疟疾疫苗开发、对抗抗生素耐药性与塑料污染等场景中得到应用,并且帮助研发人员加速新药研发。
此次,团队再次免费公开了最新的数据库,所有2亿多个蛋白质结构都能通过数据库下载。这份前所未有的丰富数据,将帮助我们探索生命科学的无尽奥秘,并对生物学、医药领域产生持久影响。

参考资料:

[1] AlphaFold reveals the structure of the protein universe. Retrieved July 28, 2022 from https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe

[2] ‘The entire protein universe’: AI predicts shape of nearly every known protein. Retrieved July 28, 2022 from https://www.nature.com/articles/d41586-022-02083-2

[3] ‘The entire protein universe’: AI predicts shape of nearly every known protein.  Retrieved July 28, 2022 from https://www.newscientist.com/article/2330866-deepminds-protein-folding-ai-cracks-biologys-biggest-problem/

(药明康德团队编辑)


相关文章

智能医疗板块飙升,科技巨头深化AI在医疗领域的创新应用

导读:“随着人工智能技术的迅猛发展,其在医疗领域的应用也日益广泛。科技巨头们纷纷瞄准这一趋势,加大在“AI+医疗”领域的投入和布局,以期在这一新的赛道上抢占先机。”近期,AI+医疗板块在股市中表现活跃......

智能医疗板块飙升,科技巨头深化AI在医疗领域的创新应用

导读:“随着人工智能技术的迅猛发展,其在医疗领域的应用也日益广泛。科技巨头们纷纷瞄准这一趋势,加大在“AI+医疗”领域的投入和布局,以期在这一新的赛道上抢占先机。”近期,AI+医疗板块在股市中表现活跃......

阿里巴巴全球数学竞赛首次向AI开放

学好数学,无论对人类还是AI都至关重要。3月14日国际数学日,2024阿里巴巴全球数学竞赛开始报名。今年赛事最大的革新在于首次向AI开放,诚邀全球AI大模型挑战竞赛难度试题。数学不仅承载人类智慧的杰出......

阿里巴巴全球数学竞赛首次向AI开放

学好数学,无论对人类还是AI都至关重要。3月14日国际数学日,2024阿里巴巴全球数学竞赛开始报名。今年赛事最大的革新在于首次向AI开放,诚邀全球AI大模型挑战竞赛难度试题。数学不仅承载人类智慧的杰出......

英伟达年度AI大会召开在即机器人板块大涨

3月15日早盘,机器人板块多股大涨,概念指数涨超1%,固高科技20cm涨停,瑞德智能、丰立智能、赛摩智能、天奇股份、智信精密等涨幅居前,均在8%以上。消息面上,英伟达GTC大会将于3月18日至21日期......

英伟达年度AI大会召开在即机器人板块大涨

3月15日早盘,机器人板块多股大涨,概念指数涨超1%,固高科技20cm涨停,瑞德智能、丰立智能、赛摩智能、天奇股份、智信精密等涨幅居前,均在8%以上。消息面上,英伟达GTC大会将于3月18日至21日期......

新探针可实现对蛋白质N端组学深度富集检测

中国科学院上海药物研究所研究员黄河、柳红合作,研究设计合成了一种含有吡啶甲醛片段的可断裂分子探针2PCA-Probe,可实现对蛋白质N-端的深度富集检测。相关研究发表于《美国化学会志》。蛋白质水解是一......

预测蛋白质“糖衣”形态有了新方法有助于药物研发

2月29日,德国、波兰、法国与中国台湾组成的科研团队在学术期刊《细胞》发表成果,开发出能在几分钟之内预测蛋白质“糖衣”形态的新型计算方法,有助于进一步了解蛋白质在健康和疾病中的作用,帮助药物与疫苗研发......

邓中翰委员:布局芯片产业,助力新质生产力发展

当前,人工智能(AI)正在全球引领新一轮科技革命,各国都在紧锣密鼓地布局人工智能产业。在今年的两会上,全国政协委员、中国工程院院士邓中翰提交了一份关于AI时代精准支持芯片产业高质量发展的提案,希望助力......

邓中翰委员:布局芯片产业,助力新质生产力发展

当前,人工智能(AI)正在全球引领新一轮科技革命,各国都在紧锣密鼓地布局人工智能产业。在今年的两会上,全国政协委员、中国工程院院士邓中翰提交了一份关于AI时代精准支持芯片产业高质量发展的提案,希望助力......