DeepMind近日公布了AlphaFold的最新进展:已预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质,再次刷新了我们对它的期待。AlphaFold 2横空出世时的热烈场景重现,再次在国内外的社交媒体上引发热议。但作为“圈内人”的生命科学领域研究者们,对AlphaFold此次公布的成果却褒贬不一。


在此前潘毅、周耀旗、许东等几位生物信息学领域的学者曾表示:AlphaFold蛋白质结构数据库此次更新的海量数据中存在着部分结果结构不稳定、不能应用于研究中等问题。

加拿大蒙特利尔大学MILA实验室唐建教授也向医健AI掘金志表示,AlphaFold预测出的蛋白质对药物研发的影响有限。

近期,美国一位制药行业的资深专家Derek Lowe博士发文,对外界尤其是媒体热捧的AlphaFold进行了一番吐槽。

Derek Lowe博士毕业于杜克大学,在大型制药公司工作了三十余年,从事治疗精神分裂症、阿尔茨海默氏症、糖尿病、骨质疏松症和其他疾病的药物发现项目。

Derek Lowe

上周,Derek Lowe在英国皇家化学学会(Royal Society of Chemistry)的网站上发布了一篇文章。

他旗帜鲜明地指出:AlphaFold不会带来药物研发领域的革新。

以下为Derek Lowe的文章,雷峰网(公众号:雷峰网)做了不改变原意的整理。

长期以来,蛋白质结构预测一直被认为是计算生物学中最困难的问题之一。

但是在过去的一两年中,AlphaFold在这方面的工作上取得了显著的进步,预测出绝大部分人体蛋白质的组织结构。

如果放在十年前,这样的成果就像科幻故事一样。

我并不想否认AlphaFold取得的成果,但是一些新闻报道错误地理解了AlphaFold这一成果的意义。

我们并没有在理解“蛋白质为什么会这样折叠”方面取得巨大飞跃。

蛋白质结构通常情况下以线圈、环或片状的形态存在,但为什么不继续深入其中进行研究?

如果只在目前的层面上进行研究,将无法发现许多隐秘的答案。

我们早就拥有成千上万的新蛋白质结构预测结果,绝大部分是正确的。而且,尽管有一些例外,它们似乎确实大部分是正确的。

AlphaFold的算法在面对无序的蛋白质区域时会无法正常工作,AlphaFold的整个计算技术都建立在寻找已知结构的类比上,在没有可比较结构的情况下,AlphaFold也无计可施。

一部分无序的蛋白质在各种蛋白质的影响下能够进行有序排列,但也有一部分蛋白质在任何条件下都从未出现过有序的结构。

当蛋白质无法形成有序结构的时候,就超出了AlphaFold的计算能力。

AlphaFold提供了其结构预测的置信度。深蓝色结构的置信度更高,而黄色和橙色结构的置信度较低

需要强调的是,通过AlphaFold,我们得到的是蛋白质结构的预测,而非真正的蛋白质结构。

AlphaFold是很实用的蛋白质预测方法,但通过X射线、核磁共振或冷冻电镜等方式获取蛋白质的实际数据,才是确定其准确性的唯一方法。

但由于构象的灵活性,即使是实际数据也无法完全代表其准确性。

这正是媒体报道中夸大AlphaFold蛋白质结构数据库对药物研发影响的地方。

在小分子配体的存在下,蛋白质结构会发生变化和滑动,有时细微有时剧烈,但AlphaFold还无法预测这些变化。

也许最终能够找到这些问题的算法解决方案,但到目前为止,还没有足够多能够与小分子配体结合蛋白结构。我们需要的数量非常多。

有大约20种不同的蛋白质侧链需要考虑,但小分子结构的数量如此巨大,相比之下几乎是无限的。

还有一点,听起来很刺耳(尽管这是真的):在药物研发的过程中,对蛋白质结构的了解,鲜少影响研发进度。

因为研究者们通常在使用纯蛋白或活细胞进行检测的基础上运行项目。检测数据则代表着化合物是否符合研究者的要求,以及是否随着新化合物制造而表现更好。

蛋白质的结构可能会对研究者们下一步制造什么化合物有所启发,但也可能没有任何帮助。

归根结底,来自真实生物系统的真实数字才是最重要的。

随着药物研发项目的进行,这些数字涵盖了药代动力学、新陈代谢和毒理学的检测,这些都无法真正从蛋白质结构水平上处理。

激流之后往往才是最终的瀑布。

新药在最后的临床环节失败,往往是因为我们选择了错误的靶点或其他难以预料的原因。

而蛋白质结构预测对减轻这两种风险都无济于事,这就是药物研发的临床失败率高达85%的原因。

蛋白质结构预测的确是一个非常棘手的问题,但药物研发中面临的风险明显难度更甚。

Derek Lowe这篇文章发布后,也引发了两派读者的讨论。

支持他的读者认为,在研究中的确应该考虑到柔性蛋白质的影响,因为构象状态的变化需要逐案理解。蛋白质-蛋白质和蛋白质-核酸相互作用对了解该系统也很重要。结构本身无法解决所有问题,在取代实验数据之前,人工智能还有一段路要走。

也有读者不同意Derek Lowe的观点,认为“良好的结构预测将大大加快获取经验数据集的过程。”

一位读者表示,“基于结构的设计将是一个限制因素——在一个难以获得结构的环境中。在一个有 AlphaFold的世界中,情况不再如此。此外,可以再次运行AlphaFold,将一个小分子放入并重新折叠它周围的蛋白质。20年前,在我攻读博士学位期间,我们曾经使用sybyl 和autodock来做同样的事情——坦率地说,这些软件工具完全是垃圾。传统的药物设计就像盲人拄着拐杖一样颤颤巍巍,通过基于结构的设计,我们现在可以看到。它(AlphaFold)以前不是药物设计的重要组成部分,这一事实与未来如何发现新药无关。”

有读者认为,基于结构的药物设计活动大大有助于降低失败率。在AlphaFold缺乏实验结构的情况下与分子动力学模拟等其他计算方法相结合,远比传统方法要好得多。

不论国内还是国外,学者们对AlphaFold的评价均是褒贬不一,对其在药物研发中将产生的影响看法也不尽相同。

Derek Lowe的这篇文章,代表的是主流或者传统药企技术专家,面对新技术时一种“本能性”的抵触。

这种现象,和医学影像AI出现时,医生对AI的吐槽并无区别,本质上是两种专业背景的碰撞和对抗。但是,现在的放射科医生也逐渐接受了AI帮他们找肺结节。

得到这个问题的答案也很简单,从什么角度对AlphaFold所代表的深度学习技术进行价值评估?

AlphaFold能否为药物研发领域带来革新性的变化,你会站在哪一边?


相关文章

中国科大校友发Science!蛋白质科学界版ChatGPT来了

凝视着手中的试管,又望向桌上那些依旧在各司其职的大大小小的实验仪器,赵惠民的一颗心像是被人用力攥着。他明白,已经到了不得不放弃的时候。读博第三年,学校资格考试的巨大压力如海啸般倾泻而来,这项奋战了两年......

发现干细胞清理蛋白质垃圾的特殊机制

蛋白质稳态(proteostasis)是指细胞内蛋白质的合成、折叠、修复、降解和运输等过程的平衡状态,保证细胞内蛋白质的数量、构象和功能处于稳定的状态。蛋白质稳态对于维持细胞的正常功能、细胞增殖和生存......

化妆品+蛋白质,修复皮肤不是梦

近日,英国研究人员发现了两种蛋白质片段。研究人员将其应用在前臂皮肤上后,这块区域的关键蛋白质结构水平增加了,而这种结构能使皮肤更有弹性。由于体内炎症水平上升和暴露在紫外线辐射下,皮肤中形成弹性网络的蛋......

Nature子刊:AI像造句一样设计人工蛋白质

近年来,人工智能(AI)已在医学、生物学及制药领域中展示出广阔的发展前景。特别是在蛋白质设计和工程领域,基于AI技术创建人工的蛋白质序列已经成为现实,并可能被用于治疗各种疾病。日前,来自AI研究企业S......

Nature:柳振峰团队发现叶绿体蛋白质传送器的组装原理

叶绿体是植物和藻类细胞中可以通过光合作用将光能转化为化学能的细胞器。作为一种由两层膜包被的特殊细胞器,叶绿体含有其自身的基因组,其表达是与核基因组的表达紧密协调的。叶绿体的蛋白质有两种来源,有一小部分......

JACS|大连化物所:基于nMS表征影响蛋白质结构的分子机制

近日,连化物所生物分子结构表征新方法研究组(1822组)王方军研究员、刘哲益副研究员团队与西南交通大学封顺教授团队合作,利用我所自主搭建的高能紫外激光解离—串联质谱仪器,揭示了质子化氨基酸侧链的正电荷......

新算法可生成蛋白质5D图像揭示微小尺度下的生物学过程

美国圣路易斯华盛顿大学科研团队开发出一种机器学习算法Deep-SMOLM,可生成蛋白质5D图像,包括单个分子的方向和位置等信息。实验室的单分子成像经常存在因包含“斑点”或波动等情况导致图像模糊的问题,......

动植物跨界医疗模式新突破|动物体内成功植入光合系统

细胞的合成代谢需要消耗足够的腺嘌呤核苷三磷酸(ATP)和烟酰胺腺嘌呤二核苷酸(NADPH),而这些关键因子在病理条件下往往不足。在生命科学和临床医学的前沿探索中,一个巨大的挑战就是如何向退行性变及损伤......

研究发现叶绿体蛋白质传送器的组装原理

叶绿体是植物和藻类细胞中可以通过光合作用将光能转化为化学能的细胞器。作为一种由两层膜包被的特殊细胞器,叶绿体含有自身的基因组,且其表达是与核基因组的表达紧密协调的。叶绿体的蛋白质有两种来源,有一小部分......

柳振峰课题组等发现叶绿体蛋白质传送器的组装原理

叶绿体是植物和藻类细胞中可以通过光合作用将光能转化为化学能的细胞器。作为一种由两层膜包被的特殊细胞器,叶绿体含有自身的基因组,且其表达是与核基因组的表达紧密协调的。叶绿体的蛋白质有两种来源,有一小部分......