蛋白质空间的巨大暗面自然进化仅探索了理论可能性的极小一角
来源:Chemical & Engineering News (C&EN) | 原文链接:点击查看原文 | 发布日期:2026年4月3日地球生命历经35亿年的漫长演化,孕育出了数以百万计形态各异的蛋白质。然而,这一切看似叹为观止的多样性,在理论可能性面前却显得极为微不足道。来自冲绳科学技术大学院大学(Okinawa Institute of Science and Technology,OIST)的一项最新研究揭示了一个令人深思的事实:自然界中存在的蛋白质序列,仅仅是理论上可能存在的功能性序列空间中极其微小的一个片段——而这种局限性,将深刻影响人工智能蛋白质预测工具的能力边界。蛋白质序列:无穷可能中的一隅蛋白质是生命活动的核心执行者,其多样性根植于氨基酸序列的无穷排列组合。从理论上来说,仅由20种天然氨基酸组成的蛋白质,其序列可能性近乎无限——即便是一条只有100个氨基酸的短肽,其理论序列数量也高达20的100次......阅读全文
蛋白质空间的巨大暗面自然进化仅探索了理论可能性的极小一角
来源:Chemical & Engineering News (C&EN) | 原文链接:点击查看原文 | 发布日期:2026年4月3日地球生命历经35亿年的漫长演化,孕育出了数以百万计形态各异的蛋白质。然而,这一切看似叹为观止的多样性,在理论可能性面前却显得极为微不足道。来自冲绳科学技术大学院大学
蛋白质数据+基因序列精准构建进化树
西班牙基因组调控研究中心的科学家们在最新一期《自然·通讯》上发表了一项创新研究,展示了如何利用蛋白质三维形状,解开生命中古老的“历史密码”,揭示了生命之树中最古老的进化关系。这项研究首次将蛋白质的形状数据与基因序列数据结合,提高了进化树的准确性。蛋白质结构解决“饱和问题”(艺术概念图)。图片来源:《
预测蛋白质3D结构,单条蛋白质序列就能实现
7月22日,华深智药对外宣布,公司在蛋白质结构预测方面开发出一项新技术OmegaFold,突破了已有计算机预测三维结构的模式,是人工智能(AI)和生命科学领域结合实现的一个突破。华深智药是由清华大学人工智能产业研究院孵化,是一家致力于使用AI重构药物开发流程来提高新药研发速度和效率的企业。日前,华深
清华大学团队提出蛋白质序列功能空间压缩的概念
蛋白质作为最重要的生命构建单元之一,其序列和功能之间的映射(适应性景观,Fitness landscape)的针对性研究对于蛋白质理性设计以及工程应用都有极大的意义。目前人们只能对于蛋白质序列-功能关系进行少量低纬度的点采样,例如深度突变搜索(DMS)、单位点饱和突变等,或是利用随机建库等方式以极低
深度学习助力提高蛋白质序列设计成功率
中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。相关成果7月21日发表于《自然—计
深度学习实现蛋白质序列高成功率从头设计
中国科学技术大学生命科学与医学部教授刘海燕、副教授陈泉团队与信息科学技术学院教授李厚强团队合作,开发了一种基于深度学习为给定主链结构从头设计氨基酸序列的算法ABACUS-R。经过实验验证,ABACUS-R的设计成功率和设计精度超过了原有统计能量模型ABACUS。研究成果北京时间7月21日发表于《
Cell-Res:我国学者开发零样本突变效应预测模型
蛋白质序列上的氨基酸突变可导致蛋白质功能发生变化,并与酶失活、遗传疾病和病毒免疫逃逸等生物过程密切相关。精确预测氨基酸突变效应对指导蛋白质设计改造等下游应用具有显著意义。 通过探索蛋白质适应度景观并识别潜在有利突变,突变效应预测方法能够解决定向进化和理性设计策略面临的诸多挑战,并可缩短时间周期
Nature发布AlphaFold预测几乎所有已知蛋白质的形状
DeepMind的AlphaFold工具已经确定了地球上几乎所有已知生物体中约2亿种蛋白质的结构。从今天开始,确定科学上已知的几乎所有蛋白质的3D形状将变得和在谷歌搜索中输入一样简单。研究人员使用革命性的人工智能(AI)网络:AlphaFold来预测来自100万种物种的约2亿种蛋白质的结构,几乎覆盖
蛋白质进化的相关介绍
可以用免疫学方法测定各种生物的蛋白质的亲缘关系,例如用人的清蛋白注射家兔,从家兔取得抗血清,把抗血清分别和人、大猩猩、黑猩猩等的清蛋白进行沉淀反应测定,可以看到愈是亲缘关系相近的清蛋白沉淀反应愈强。同工酶的电泳测定是70年代发展起来的可以用来比较生物蛋白质的亲缘关系的方法。同工酶是功能相同而一级结构
蛋白质序列分析和结构预测
【实验目的】1、掌握蛋白质序列检索的操作方法;2、熟悉蛋白质基本性质分析;3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、 结构位点、结构功能域数据库的蛋白质功能预测;4、了解蛋白质结构预测。【实验内容】1、使用Entrez或SRS信息查询系统检索人脂联素 (adiponectin)
蛋白质序列分析和结构预测
【实验目的】 1、掌握蛋白质序列检索的操作方法; 2、熟悉蛋白质基本性质分析; 3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测; 4、了解蛋白质结构预测。【实验内容】 1、使用Entrez或SRS信息查询系统检索人脂联素(ad
核酸和蛋白质序列分析1
在获得一个基因序列后,需要对其进行生物信息学分析,从中尽量发掘信息,从而指导进一步的实验研究。通过染色体定位分析、内含子/外显子分析、ORF分析、表达谱分析等,能够阐明基因的基本信息。通过启动子预测、CpG岛分析和转录因子分析等,识别调控区的顺式作用元件,可以为基因的调控研究提供基础。通过蛋白质基本
核酸和蛋白质序列分析2
(2)输出:除了以文本形式外,还可以通过JalView显示和编辑结果。此外,还可以另外使用GeneDoc(常见于文献)及DNAStar软件等显示结果。多序列比对的结果还用于进一步绘制进化树。3、ORF(Open Reading Frame)分析从核酸序列翻译得到蛋白质序列,需要进行ORF分析,每个生
AI时代的2024年诺贝尔物理学奖化学奖
人工智能正迅速走向超人智力阶段。尝试过 OpenAI-o1 的就知道它确实达到了博士水平 ---用复杂的物理数学问题检测发现,它不仅是掌握了相关知识,还能够探索式思考。复杂的数学计算对AI来说,毫无畏惧,再加上超强的物理思维能力,AI 让人一次次震惊---而这仅仅是开始。这样下去,不久的将来人
直播预告-|-蛋白质结构与功能预测及设计
直播时间:2024年8月22日(周四)19:00——21:40 直播平台:科学网APP(科学网微博直播间链接)https://weibo.com/l/wblive/p/show/1022:2321325069047447289984科学网微博科学网视频号 【直播简介】8月22日(周四)晚19:0
《科学》:人工智能几秒便可设计“原创”新蛋白质
今年6月,韩国监管机构批准了首款由人类设计的新型蛋白质制成的新冠肺炎疫苗。该疫苗基于一种球形蛋白质“纳米颗粒”,由研究人员在10年前通过劳动密集型试错攻关研制而成。现在,随着人工智能(AI)的巨大进步,美国西雅图华盛顿大学(UW)生物化学家David Baker领导的一个团队,只需几秒钟——而不是几
AlphaFold解析了迄今为止最复杂的蛋白质结
蛋白质的化学成分,即氨基酸序列,如何决定其三维结构的问题,是半个多世纪以来生物物理学面临的最大挑战之一。这种关于所谓蛋白质“折叠”的知识需求量很大,因为它对理解各种疾病及其治疗等方面有重大贡献。出于这些原因,谷歌的DeepMind研究团队开发了AlphaFold,这是一款可以预测3D结构的人工智能。
什么是蛋白质设计?
蛋白质设计是新蛋白质分子的合理设计,旨在设计新的活性,行为或目的,并增进对蛋白质功能的基本了解。可以从头开始设计蛋白质(从头设计),也可以通过对已知蛋白质结构及其序列进行计算得出的变体进行设计(称为蛋白质重新设计)。合理的蛋白质设计方法可以预测蛋白质序列,并将其折叠成特定的结构。然后可以通过诸如肽合
关于抗冻蛋白质的进化介绍
APF显著的多样性和分布提示进化成不同类型是相应1-2百万年前在北半球发生和1千万-3千万年前在南极发生的海平面冰川作用的结果。这种独立发展的相似的适应化叫做趋同演化(进化)。为什么许多类型的AFP尽管它们具有多样性,但是却能执行相同的功能。这有两个原因: 1、尽管冰是统一由氧和氢构成的,它有
加速蛋白质进化的新技术
所有的生物都需要蛋白质,蛋白质这个巨大的分子家族,是大自然根据基因中的蓝图定制而来的。 通过自然的进化过程,DNA突变会产生新的或更有效的蛋白质。人类已经发现了这些分子有那么多的替代用途——作为食品、工业酶、抗癌药物,因此,科学家们渴望更好地了解如何设计用于特定用途的蛋白质变体。 现在,斯坦
研究显示蛋白质进化难以逆转
新华网伦敦9月24日电(记者黄堃)生物进化是否可逆一直是人们感兴趣的问题。最新一期英国《自然》杂志刊登的研究报告说,分子水平的实验显示,蛋白质一旦向前进化,便难以原路返回过去的状态。 美国俄勒冈大学等机构的研究人员发表报告说,他们研究了一种被称为“糖皮质激素受体”的蛋白质进化路线。它存在于
蛋白质序列分析和结构预测实验
蛋白质序列分析和结构预测实验 实验步骤 1. 人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其
蛋白质序列分析和结构预测实验
实验步骤 1. 人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其地址栏输入Entrez网址(http://www.ncbi.nlm.nih.gov/Entrez);(2)在Search后的选择栏中选择protein;(3)在输入栏输入homo sapiens adiponectin;
蛋白质序列分析和结构预测实验
实验步骤1. 人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其地址栏输入Entrez网址(http://www.ncbi.nlm.nih.gov/Entrez);(2)在Search后的选择栏中选择protein;(3)在输入栏输入homo sapiens adiponectin;(
AI驱动的蛋白质设计
扩散模型已被证明在图像和文本生成中很有用,而且似乎也适用于蛋白质设计。然而,这类模型目前的成功率并不高;产生的序列基本不能折叠成目标结构。而近期,由《自然》(Nature)发表的一篇论文描述了一种能设计新蛋白质的深度学习方法,名为RoseTTAFold Diffusion(RFdiffusion
简述蛋白质结构在蛋白质设计中的应用
蛋白质设计的目标是通过计算机辅助的算法以生成符合目标蛋白质三维结构的氨基酸序列,经过漫长的进化,自然界已经筛选出了数量众多的蛋白质,但天然蛋白质只有在自然条件下才发挥最佳功能,这使得人们利用这些蛋白质受到了限制,因此需要对蛋白质进行改造使其能适应特定条件发挥特定的功能。蛋白质分子的设计分为3类:
上海药物所提出机器学习辅助定向进化新方法
定向进化是模拟自然进化机制,利用现代分子生物学方法创造大量的突变基因文库,采用灵敏的定向筛选策略,创造出自然界不存在的或改良特性的蛋白质等生物分子的一种方法。定向进化已广泛应用于蛋白质的分子改造和优化,被认为是生产具有改良或全新特性的蛋白质的高效方法,对于酶工程、多肽和大分子药物设计都具有重要意义。
基于序列的药物设计新方法
20世纪90年代以来,基于蛋白质结构的药物设计(SBDD)一直是创新药物发现的主流方法,在针对具有明确靶标的疾病治疗方面取得了进步。这种方法一般涉及多个步骤的复杂流程,包括建立蛋白质的三维(3D)结构,识别潜在的配体结合位点,并通过虚拟筛选或全新设计发现活性化合物等。SBDD流程中的每个步骤都有
最新模型定义蛇毒进化-剧毒蛋白质进化于无毒基因
据科学日报报道,目前描绘蛇或者蜥蜴嘴巴内部主要基因的科技改变了科学家们将动物定义为有毒的方式。如果口腔腺体能够表达与“毒素”相关的20个基因家族中的一些基因,那么这个物种就被定义为有毒。然而,美国德克萨斯大学阿灵顿分校的一项最新研究挑战了这一定义,这些研究还建立了一个描述蛇毒是如何产生的新模型。
为什么诺贝尔化学奖又被人工智能学者拿了?
今天诺贝尔化学奖开奖,三位得奖者均是因为对蛋白质的杰出贡献获奖,其中华盛顿大学西雅图分校的 David Baker是因为 “计算蛋白质设计”,另后两位是英国伦敦 Google DeepMind 的 Demis Hassabis 和John M. Jumper在“蛋白质结构预测”的贡献。 我在昨