使用伪氨基酸组成和模糊支持向量机预测蛋白质结构类

摘要: 蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou 提出的伪氨基酸离散模型框架, 从蛋白质序列出发, 设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合( 10-D) 在序列中出现的频率和疏水氨基酸模式( 6-D) 表示蛋白质序列的附加特征, 用和传统的氨基酸组成( 20-D) 一起构成的36 维的伪氨基酸组成向量来表示蛋白质序列的特征。使用遗传算法来优化附加特征的权重系数。伪氨基酸组成向量作为输入数据, 模糊支持向量机作为预测工具。使用三个常用的标准数据集来验证算法的性能。Jackknife检验结果说明本方法具有较高的准确率, 有望成为潜在的预测蛋白质功能的工具。点击这里进入下载页面:进入下载页面......阅读全文

基于氨基酸组成的蛋白质预测软件

根据组成蛋白质的20种氨基酸的物理和化学性质可以辨析电泳等实验中的未知蛋白质,也可以分析已知蛋白质的物化性质。ExPASy工具包包涵的程序:http://www.expasy.ch/tools/AACompIdent:与把氨基酸序列在SWISS-PROT库中搜索不同,AACompIdent工具利用未

蛋白质二级结构预测-基于氨基酸疏水性的预测方法

这种方法是一种用物理化学方法进行二级结构预测的方法,或称为立体化学方法。在蛋白质中,氨基酸的理化性质对蛋白质的二级结构影响较大,因此在进行结构预测时考虑氨基酸残基的物理化学性质,如疏水性、极性、侧链基团的大小等,根据氨基酸残基各方面的性质及残基之间的组合预测可能形成的二级结构。“疏水性”是氨基酸的一

组成蛋白质的氨基酸均为α氨基酸

氨基酸(amino acid):含有氨基和羧基的一类有机化合物的通称。生物功能大分子蛋白质的基本组成单位,是构成动物营养所需蛋白质的基本物质。是含有一个碱性氨基和一个酸性羧基的有机化合物。氨基连在α-碳上的为α-氨基酸。组成蛋白质的氨基酸均为α-氨基酸。  基酸中包含的羧基(COOH),氨基(NH

组成蛋白质的氨基酸介绍

氨基酸是合成蛋白质的基本单位。在生物体内组成蛋白质的氨基酸有20种。每种氨基酸分子至少都含有一个氨基(—NH2)和一个羧基(—COOH),并且都有一个氨基和羧基连接在同一个碳原子上。这个碳原子还连接一个氢原子和一个侧链基团,一般这个侧链基团用R表示。各种氨基酸之间的区别在于R基的不同。氨基酸电荷和结

关于蛋白质结构的结构预测介绍

  测定蛋白质序列比测定蛋白质结构容易得多,而蛋白质结构可以给出比序列多得多的关于其功能机制的信息。因此,许多方法被用于从序列预测结构。  一、二级结构预测  二、三级结构预测  同源建模:需要有同源的蛋白三级结构为基础进行预测。  Threading法。“从头开始”(Ab initio):只需要蛋

蛋白质结构预测(protein-structure-prediction)

一种生物体的基因组规定了所有构成该生物体的蛋白质,基因规定了组成蛋白质的氨基酸序列。虽然蛋白质由氨基酸的线性序列组成,但是,它们只有折叠成特定的空间构象才能具有相应的活性和相应的生物学功能。了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物

蛋白质序列分析和结构预测

【实验目的】   1、掌握蛋白质序列检索的操作方法;  2、熟悉蛋白质基本性质分析;  3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测;  4、了解蛋白质结构预测。【实验内容】   1、使用Entrez或SRS信息查询系统检索人脂联素(ad

蛋白质序列分析和结构预测

【实验目的】1、掌握蛋白质序列检索的操作方法;2、熟悉蛋白质基本性质分析;3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、 结构位点、结构功能域数据库的蛋白质功能预测;4、了解蛋白质结构预测。【实验内容】1、使用Entrez或SRS信息查询系统检索人脂联素 (adiponectin)

ChouFasman预测方法预测蛋白质二级结构

Chou-Fasman方法是一种基于单个氨基酸残基统计的经验参数方法,由Chou和Fasman在20世纪70年代提出来。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。每种氨基酸残基出现在各种二级结构中倾向或者频率是不同的,例如Glu主要出

蛋白质二级结构预测-综合各种分析方法预测

综合各种分析方法预测在实际进行蛋白质二级结构预测时,往往会综合应用各种分析方法和相关数据。综合方法不仅包括各种预测方法的综合,而且也包括结构实验结果、序列对比结果、蛋白质结构分类预测结果等信息的综合。实际应用中最常见的综合方法是同时使用多个软件进行预测,通过分析各个软件的特点以及各个软件预测结果,最

蛋白质序列分析和结构预测实验

实验步骤 1.  人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其地址栏输入Entrez网址(http://www.ncbi.nlm.nih.gov/Entrez);(2)在Search后的选择栏中选择protein;(3)在输入栏输入homo sapiens adiponectin;

蛋白质序列分析和结构预测实验

实验步骤1.  人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其地址栏输入Entrez网址(http://www.ncbi.nlm.nih.gov/Entrez);(2)在Search后的选择栏中选择protein;(3)在输入栏输入homo sapiens adiponectin;(

蛋白质序列分析和结构预测实验

蛋白质序列分析和结构预测实验             实验步骤 1.  人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其

关于蛋白质结构的组成介绍

  一、化学组成:  (1)单纯蛋白质:仅含有AAs;  (2)结合蛋白质:由AAs和其他非蛋白质化合物所组成;  (3)衍生蛋白质:用化学或酶学方法得到的化合物。  二、分子组成:  基本单位:氨基酸 有不同的AAs通过肽键相互连接而成;  蛋白质→眎→胨→多肽→二肽→多肽→氨基酸。  三、元素组

蛋白质三级机构(空间结构)预测-从头预测法

H-P模型是基于三种简化的,即蛋白质中各个氨基酸残基的α碳原子都位于二维网格或三维网格的格点上,疏水作用是蛋白折叠中唯一的重要因素,同时通过计算疏水残基接触的数目代替构象的能量计算。虽然这样的处理非常简单,但是,通过H-P模型的计算分析,能够发现蛋白质折叠的一些机制。如果在蛋白质模型中取消氨基酸定位

蛋白质结构预测和分子动力学

   作为结构基因组研究的互补,蛋白质结构预测的目标是发展出有效的能够提供未知结构(未通过实验方法得到)蛋白质的可信的结构模型。目前最为成功的结构预测方法是同源建模;这一方法是利用序列相似的蛋白质(已知结构)的结构作为“模板”。而结构基因组的目标正是通过解析大量蛋白质的结构来为同源建模提供足够的模板

Meta公司AI预测6亿蛋白质结构

ESM宏基因组图谱数据库包含6.17亿个蛋白质的结构预测。图片来源:ESM宏基因组图谱 谷歌旗下人工智能(AI)公司Deep Mind今年公布了2.2亿个蛋白质的预测结构,几乎涵盖了DNA数据库中已知生物的所有蛋白质。现在,另一个科技巨头正在填补蛋白质宇宙中的暗物质。 Meta公司(前

蛋白质三级机构(空间结构)预测-从头预测法...1

从头预测模型的基本思想在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法(Abinitio),即(直接)仅仅根据序列本身来预测其结构。在1994年之前,还没有一个从头算方法能够预测蛋白质的空间结构。从那以后,人们陆续提

蛋白质是由氨基酸组成的,那么吃氨基酸片和蛋白质粉有什么差别?

  在人体内起的作用都一样,主要是吸收速度不一样。通常情况下,蛋白质需用2-4小时才能被消化。但如果将蛋白质分裂为短肽(微肽由2-3个氨基酸构成)和单个的自由氨基酸 ,则在30-60分钟内就能被人体吸收。因此,氨基酸非常容易被人体消化吸收,这也是氨基酸的最大优势。

MIT最新研究:从氨基酸链片段直接预测蛋白质功能

  就在几个月前,DeepMind推出了AlphaFold系统,这个被称为生物界“AlphaGo”的系统能够预测并生成蛋白质3D结构。而近日,来自MIT的研究人员开发了一个新的研究模型,能够直接预测氨基酸链片段是如何决定蛋白质功能的。这一发现可以帮助研究人员设计和测试新的蛋白质,从而用于药物研发和生

氨基酸的组成

  氨基酸分子中含有氨基和羧基两种官能团。  与羟基酸类似,氨基酸可按照氨基连在碳链上的不同位置而分为α-,β-,γ-,w-...氨基酸,但经蛋白质水解后得到的氨基酸都是α-氨基酸,而且仅有二十二种,包括甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸(蛋氨酸)、脯氨酸、色氨酸、丝氨酸、酪氨酸、半

从预测进化-AI能“构想”新蛋白质结构

  半个世纪以来,科学家一直在寻找解决“蛋白质折叠问题”的方法。这是生物学领域的一项重大挑战,难倒了几代科学家。但现在,人工智能(AI)解决了这一问题。据《自然》杂志1日发表的论文,包括美国华盛顿大学、伦斯勒理工学院和哈佛大学的研究人员在内的研究小组描述了一种升级的阿尔法折叠系统,该系统由深度思维(

直播预告-|-蛋白质结构与功能预测及设计

  直播时间:2024年8月22日(周四)19:00——21:40 直播平台:科学网APP(科学网微博直播间链接)https://weibo.com/l/wblive/p/show/1022:2321325069047447289984科学网微博科学网视频号 【直播简介】8月22日(周四)晚19:0

蛋白质三级结构预测-线索化法

线索化模型产生的背景及发展上面已经提到,两个自然进化的蛋白质如果具有30%的等同序列,则它们是同源的蛋白质,具有基本相同的三维结构。那么,其余的是否就不是同源的呢?实际并非如此。在最新的蛋白质数据库PDB中,有上千对蛋白质具有同源的空间结构,但它们的序列等同部分小于25%,即远程同源。许多结构相似的

预测蛋白质3D结构,单条蛋白质序列就能实现

7月22日,华深智药对外宣布,公司在蛋白质结构预测方面开发出一项新技术OmegaFold,突破了已有计算机预测三维结构的模式,是人工智能(AI)和生命科学领域结合实现的一个突破。华深智药是由清华大学人工智能产业研究院孵化,是一家致力于使用AI重构药物开发流程来提高新药研发速度和效率的企业。日前,华深

蛋白质序列分析及结构预测策略包括哪些步骤

  序列分析通常就是指同源性分析、保守位点分析,motif分析和功能预测等,结构预测通常又包括二级结构三级结构甚至四级结构,二级结构目前预测还是比较准确的,三级结构最简单的可以直接将蛋白序列提交swissmodel在线进行预测,也可以采用一些其他软件,如modeller和一些商业软件,主要原理是同源

蛋白质二级结构预测-最邻近方法-NearestNeighboringmethods

早期,由于数据的缺乏,预测方法多基于单条序列。随着序列和结构数据的增加,人们的研究转向同源序列分析,充分利用隐藏在同源序列中的结构信息,使得结构预测的准确率得到了较大的提高。同源分析的基础是序列比较,通过序列比较发现相似的序列,根据相似序列具有相似结构的原理,将相似序列(或者序列片段)所对应的二级结

蛋白质工程的结构、功能的设计和预测

  根据对天然蛋白质结构与功能分析建立起来的数据库里的数据,可以预测一定氨基酸序列肽链空间结构和生物功能;反之也可以根据特定的生物功能,设计蛋白质的氨基酸序列和空间结构。通过基因重组等实验可以直接考察分析结构与功能之间的关系;也可以通过分子动力学、分子热力学等,根据能量最低、同一位置不能同时存在两个

蛋白质二级结构(protein-secondary-structure)预测软件

蛋白质二级结构的预测通常被认为是蛋白结构预测的第一步,二级结构是指α螺旋和β折叠等规则的蛋白质局部结构元件。不同的氨基酸残基对于形成不同的二级结构元件具有不同的倾向性。按蛋白质中二级结构的成分可以把球形蛋白分为全α蛋白、全β蛋白、α+β蛋白和α/β蛋白等四个折叠类型。预测蛋白质二级结构的算法大多以已

蛋白质二级结构预测(protein-secondary-structure-prediction)

蛋白质二级结构的预测开始于20世纪60年代中期。二级结构预测的方法大体分为三代,第一代是基于单个氨基酸残基统计分析,从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。第二代预测方法是基于氨基酸片段的统计分析,使用大量的数据作为统计基础,统计的对象不再是单个氨基酸残基,而