蛋白质序列中的关联规则发现及其应用
摘要:随着蛋白质序列- 结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算法,找到了蛋白质序列中数以万计的模式。结合实例演示了如何将这些模式应用于蛋白质序列分析中,如保守区域发现、二级结构预测等。同时根据这些结果构建了一个二级结构规则库和一种简单的二级结构预测算法,实验结果表明,约81%的二级结构可以由至少一条关联规则预测得到。点击这里进入下载页面:进入下载页面......阅读全文
蛋白质序列分析和结构预测
【实验目的】1、掌握蛋白质序列检索的操作方法;2、熟悉蛋白质基本性质分析;3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、 结构位点、结构功能域数据库的蛋白质功能预测;4、了解蛋白质结构预测。【实验内容】1、使用Entrez或SRS信息查询系统检索人脂联素 (adiponectin)
蛋白质序列分析和结构预测
【实验目的】 1、掌握蛋白质序列检索的操作方法; 2、熟悉蛋白质基本性质分析; 3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测; 4、了解蛋白质结构预测。【实验内容】 1、使用Entrez或SRS信息查询系统检索人脂联素(ad
蛋白质序列分析和结构预测实验
实验步骤 1. 人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其地址栏输入Entrez网址(http://www.ncbi.nlm.nih.gov/Entrez);(2)在Search后的选择栏中选择protein;(3)在输入栏输入homo sapiens adiponectin;
蛋白质序列分析和结构预测实验
实验步骤1. 人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其地址栏输入Entrez网址(http://www.ncbi.nlm.nih.gov/Entrez);(2)在Search后的选择栏中选择protein;(3)在输入栏输入homo sapiens adiponectin;(
蛋白质序列分析和结构预测实验
蛋白质序列分析和结构预测实验 实验步骤 1. 人脂联素蛋白质序列的检索(1)调用Internet浏览器并在其
蛋白质二级结构预测-综合各种分析方法预测
综合各种分析方法预测在实际进行蛋白质二级结构预测时,往往会综合应用各种分析方法和相关数据。综合方法不仅包括各种预测方法的综合,而且也包括结构实验结果、序列对比结果、蛋白质结构分类预测结果等信息的综合。实际应用中最常见的综合方法是同时使用多个软件进行预测,通过分析各个软件的特点以及各个软件预测结果,最
ChouFasman预测方法预测蛋白质二级结构
Chou-Fasman方法是一种基于单个氨基酸残基统计的经验参数方法,由Chou和Fasman在20世纪70年代提出来。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。每种氨基酸残基出现在各种二级结构中倾向或者频率是不同的,例如Glu主要出
蛋白质二级结构预测-最邻近方法-NearestNeighboringmethods
早期,由于数据的缺乏,预测方法多基于单条序列。随着序列和结构数据的增加,人们的研究转向同源序列分析,充分利用隐藏在同源序列中的结构信息,使得结构预测的准确率得到了较大的提高。同源分析的基础是序列比较,通过序列比较发现相似的序列,根据相似序列具有相似结构的原理,将相似序列(或者序列片段)所对应的二级结
蛋白质二级结构(protein-secondary-structure)预测软件
蛋白质二级结构的预测通常被认为是蛋白结构预测的第一步,二级结构是指α螺旋和β折叠等规则的蛋白质局部结构元件。不同的氨基酸残基对于形成不同的二级结构元件具有不同的倾向性。按蛋白质中二级结构的成分可以把球形蛋白分为全α蛋白、全β蛋白、α+β蛋白和α/β蛋白等四个折叠类型。预测蛋白质二级结构的算法大多以已
蛋白质二级结构预测(protein-secondary-structure-prediction)
蛋白质二级结构的预测开始于20世纪60年代中期。二级结构预测的方法大体分为三代,第一代是基于单个氨基酸残基统计分析,从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。第二代预测方法是基于氨基酸片段的统计分析,使用大量的数据作为统计基础,统计的对象不再是单个氨基酸残基,而
二级结构预测的
中文名称二级结构预测英文名称secondary structure prediction定 义预测大分子(核酸、蛋白质)可能具有的二级结构。现在已有多种计算机软件可以进行这类预测,如nnPREDICT、ZPRED Server等。应用学科生物化学与分子生物学(一级学科),方法与技术(二级学科)
蛋白质序列分析及结构预测策略包括哪些步骤
序列分析通常就是指同源性分析、保守位点分析,motif分析和功能预测等,结构预测通常又包括二级结构三级结构甚至四级结构,二级结构目前预测还是比较准确的,三级结构最简单的可以直接将蛋白序列提交swissmodel在线进行预测,也可以采用一些其他软件,如modeller和一些商业软件,主要原理是同源
远紫外CD-预测蛋白质二级结构的方法
利用圆二色光谱仪获得蛋白质CD 主要的工作包括:溶剂体系的选择,蛋白质溶液样品的制备[14 ] ,圆二色光谱仪实验参数的选择与调整等。对此,Kelly 等[15 ] 已经作了较为全面的综述。正确的蛋白质CD 图谱是预测蛋白质结构的基础与关键。在正确获得蛋白质CD 后,主要的工作是如何从CD 图谱
蛋白质二级结构预测-人工神经网络方法
人工神经网络是一种复杂的信息处理模型。随着神经网络研究的兴起,科学家们也将神经网络用于生物信息学,其中包括二级结构的预测、蛋白质结构的分类、折叠方式的预测以及基因序列的分析等等。将神经网络用于二级结构预测的最早是由Qian和Sejnowskit提出的,他们受到神经网络在文字语言处理方面应用的启发,将
蛋白质二级结构预测-基于氨基酸疏水性的预测方法
这种方法是一种用物理化学方法进行二级结构预测的方法,或称为立体化学方法。在蛋白质中,氨基酸的理化性质对蛋白质的二级结构影响较大,因此在进行结构预测时考虑氨基酸残基的物理化学性质,如疏水性、极性、侧链基团的大小等,根据氨基酸残基各方面的性质及残基之间的组合预测可能形成的二级结构。“疏水性”是氨基酸的一
预测蛋白质3D结构,单条蛋白质序列就能实现
7月22日,华深智药对外宣布,公司在蛋白质结构预测方面开发出一项新技术OmegaFold,突破了已有计算机预测三维结构的模式,是人工智能(AI)和生命科学领域结合实现的一个突破。华深智药是由清华大学人工智能产业研究院孵化,是一家致力于使用AI重构药物开发流程来提高新药研发速度和效率的企业。日前,华深
预测蛋白质序列的新AI模型问世
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。CARBonAra是在一个包含约370000个
预测蛋白质序列的新AI模型问世
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。CARBonAra是在一个包含约370000个
预测蛋白质序列的新AI模型问世
瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内的多个领域带来重大进展。这一成果发表在最新一期《自然·通讯》杂志上。使用CARBonAra进行序列预测(示意图
预测蛋白质序列的新AI模型问世
使用CARBonAra进行序列预测(示意图)。图片来源:瑞士洛桑联邦理工学院科技日报北京8月8日电 (记者张佳欣)瑞士洛桑联邦理工学院开发了一种名为CARBonAra的新型人工智能(AI)驱动模型。该模型可以根据不同分子环境所施加限制的主链支架预测蛋白质序列,有望在蛋白质工程及包括医学和生物技术在内
蛋白质的二级结构与超二级结构结构的组装块
一、蛋白质的二级结构 蛋白质在细胞中必须通过详细的三维结构识别成千上万种的不同分子,这就需要蛋白质分子具有结构多样性。蛋白质结构研究得出的第一个重要的基本规律是水溶性球状蛋白质分子折叠的重要驱动力,它是将疏水侧链置于分子内部,产生一个"疏水内核"和一个亲水表面。为了把侧链放到分子内部去,相应的高度
蛋白质结构预测(protein-structure-prediction)
一种生物体的基因组规定了所有构成该生物体的蛋白质,基因规定了组成蛋白质的氨基酸序列。虽然蛋白质由氨基酸的线性序列组成,但是,它们只有折叠成特定的空间构象才能具有相应的活性和相应的生物学功能。了解蛋白质的空间结构不仅有利于认识蛋白质的功能,也有利于认识蛋白质是如何执行其功能的。确定蛋白质的结构对于生物
蛋白质二级结构的定义
成氢键,这是稳定α-螺旋的主要键。 (4)肽链中氨基酸侧链R,分布在螺旋外侧,其形状、大小及电荷影响α-螺旋的形成。酸性或碱性氨基酸集中的区域,由于同电荷相斥,不利于α-螺旋形成;较大的R(如苯丙氨酸、色氨酸、异亮氨酸)集中的区域,也妨碍α-螺旋形成;脯氨酸因其α-碳原子位于五元环上,不易扭转,加之
关于蛋白质结构的结构预测介绍
测定蛋白质序列比测定蛋白质结构容易得多,而蛋白质结构可以给出比序列多得多的关于其功能机制的信息。因此,许多方法被用于从序列预测结构。 一、二级结构预测 二、三级结构预测 同源建模:需要有同源的蛋白三级结构为基础进行预测。 Threading法。“从头开始”(Ab initio):只需要蛋
远紫外CD-预测二级结构存在的问题
随着基因工程与蛋白质工程的发展,人们迫切需要了解蛋白质的结构。CD 已经成为研究溶液中蛋白质二级结构的强有力工具,得到了越来越广泛的应用,然而远紫外CD 光谱预测蛋白质二级结构仍然存在一些不足之处。膜蛋白是近年来分子生物学研究的热点。膜蛋白是一类具有晶体类似结构的镶嵌于细胞膜上的蛋白,到目前为止,仅
概述蛋白质二级结构的形式
蛋白质二级结构的基本类型有α螺旋、β折叠、β转角、Ω环和无规卷曲。如血红蛋白和肌红蛋白中含有大量的α-螺旋,铁氧蛋白(ferredoxin)则不含任何的α螺旋。蛋白质中各种类型的二级结构并不是均匀地分布在蛋白质中,不同蛋白质中β折叠和β-转角的数量也有很大的变化。
蛋白质二级结构拟合算法
早期的蛋白质或多肽的二级结构拟合计算方法中,主要采用多聚氨基酸为参考多肽。Greenfield 等采用多聚L2赖氨酸作参考多肽,建立α2螺旋、β2折叠及无规卷曲等二级结构参考CD 光谱曲线,采用单一波长法(208nm) 计算出α2螺旋含量后,然后假设不同的β2折叠含量( Xβ) 值,并假设CD 值是
蛋白质的二级结构的特点
二级结构以往是由生物巨分子在原子量级结构下的氢键来定义的。在蛋白质,二级结构则是以主链中氨基之间的氢键模式来定义,亦即DSSP所定义的氢键,并不包括主链与旁链间或是旁链之间的氢键。而核酸的二级结构是以碱基之间的氢键来定义。在很多RNA分子,二级结构对RNA正常功能非常重要,有时甚至于较序列重要。这可
关于蛋白质二级结构的定义
蛋白质分子的二级结构(secondarystructure)通常是指蛋白质多肽链沿主链骨架方向的空间走向、规则性循环式排列,或某一段肽链的局部空间结构,即蛋白质的二级结构为肽链主链或一段肽链主链骨架原子的相对空间盘绕、折叠位置,它并不涉及氨基酸残基侧链的构象。
蛋白质二级结构的基本介绍
蛋白质二级结构(secondary structure of protein)是指多肽主链骨架原子沿一定的轴盘旋或折叠而形成的特定的构象,即肽链主链骨架原子的空间位置排布,不涉及氨基酸残基侧链。蛋白质二级结构的主要形式包括α-螺旋、β-折叠、β-转角、Ω环和无规卷曲。 [1] 由于蛋白质的分子量