蛋白质序列中的关联规则发现及其应用
摘要:随着蛋白质序列- 结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算法,找到了蛋白质序列中数以万计的模式。结合实例演示了如何将这些模式应用于蛋白质序列分析中,如保守区域发现、二级结构预测等。同时根据这些结果构建了一个二级结构规则库和一种简单的二级结构预测算法,实验结果表明,约81%的二级结构可以由至少一条关联规则预测得到。点击这里进入下载页面:进入下载页面......阅读全文
蛋白质二级结构的红外检测
蛋白质是与生命及各种形式的生命活动紧密联系在一起的物质,机体中的每一个细胞和所有重要组成部分都有蛋白质的参与。蛋白质是由不同氨基酸以肽键相连所组成的具有一定空间结构的生物大分子物质,其结构可分为以下4个结构层次: 图1 蛋白质的四个结构层次 我们所关注的蛋白质二级结构指的是蛋白质
蛋白质三级机构预测-同源模型化法2
5、构建目标蛋白质的环区:在第2步的序列比对中,可能加入空位,这些区域常常对应于二级结构元素之间的环区,对于环区需要另外建立模型。一般也是采用经验性方法,从已知结构的蛋白质中寻找一个最优的环区,拷贝其结构数据。如果找不到相应的环区,则需要用其它方法。6、优化模型:通过上述过程为目标蛋白质U建立了一个
《自然》封面:新方法根据结构预测功能
来自美国加州大学旧金山分校药理化学系,得克萨斯农工大学(Texas A&M University),Albert Einstein 医学院的研究人员利用一种变通的分子对接方法(一种用来寻找潜在药物的计算机辅助的模拟方法),设计出一种根据结构来预测某种具有未知活性的酶的功能的方法。如果这一新方法也适用
远紫外CD分析蛋白质二级结构
一、 远紫外CD分析蛋白质二级结构 远紫外CD分析蛋白质二级结构的方法,主要是运用计算机采用一定的拟合算法对CD数据进行加工处理,进而解析蛋白质二级结构。远紫外区CD光谱主要反映肽键的圆二色性。在蛋白质或多肽的规则二级结构中,肽键是高度有规律排列的,其排列的方向性决定了肽键能级跃迁的分裂情况。单一
关于蛋白质二级结构的β转角简介
多肽链中出现的180°回折的结构称为β转角(β-bend)或β回折(β-turn),即U型转折结构。它是由四个连续氨基酸残基构成,第2个氨基酸残基多为脯氨酸,甘氨酸、天冬氨酸、天冬酰胺也常出现在β转角结构中,第一个氨基酸残基的羰基与第四个氨基酸残基的亚氨基之间形成氢键以维持其稳定。 常见的转角
简述蛋白质二级结构的无规卷曲
多肽链中肽平面的一些无规则排列的无规律构象,称为无规卷曲(randomcoil)。无规卷曲通过主链间的氢键或主链与侧链间的氢键稳定其构象,是蛋白质结构中的基本构件。卷曲的柔性构象可使肽链改变走向,利于连接结构相对刚性的α螺旋和β折叠,在蛋白质肽链的卷曲、折叠过程中起重要作用。
蛋白质三级结构(tertiary-structure-of-protein)的预测软件
由于用X光晶体衍射和NMR核磁共振技术测定蛋白质的三维结构,以及用生化方法研究蛋白质的功能效率不高,无法适应蛋白质序列数量飞速增长的需要,因此近几十年来许多科学家致力于研究用理论计算的方法预测蛋白质的三维结构和功能,经过多年努力取得了一定的成果。蛋白质三维结构的预测方法通常包括:同源性建模和从头开始
蛋白质三级机构(空间结构)预测-从头预测法
H-P模型是基于三种简化的,即蛋白质中各个氨基酸残基的α碳原子都位于二维网格或三维网格的格点上,疏水作用是蛋白折叠中唯一的重要因素,同时通过计算疏水残基接触的数目代替构象的能量计算。虽然这样的处理非常简单,但是,通过H-P模型的计算分析,能够发现蛋白质折叠的一些机制。如果在蛋白质模型中取消氨基酸定位
关于蛋白质二级结构肽键平面的介绍
Pauling等人对一些简单的肽及氨基酸的酰胺等进行了X线衍射分析,从一个肽键的周围来看,得知: (1)肽键平面—肽键中的C-N键长0.132nm,比相邻的N-C单键(0.147nm)短,而较一般C=N双键(0.128nm)长,可见,肽键中-C-N-键的性质介于单、双键之间,具有部分双键的性质
关于蛋白质二级结构的β折叠的介绍
β折叠是指多肽链以肽单元为单位,以Cα为旋转点形成伸展的锯齿状折叠构象,又称3片层(3-strand)结构,具有下列特征。 (1)肽链折叠成伸展的锯齿状,肽单元间的夹角为110°,氨基酸残基的R侧链分布在片层的上下。 (2)两条以上肽链(或同一条多肽链的不同部分)平行排列,相邻肽链之间的肽键
关于蛋白质二级结构的α螺旋的介绍
蛋白质分子中多个肽平面通过氨基酸a-碳原子的旋转,使多肽主链各原子沿中心轴向右盘曲形成稳定的α螺旋(a-helix)构象。 α螺旋具有下列特征: (1)多肽链以肽单元为基本单位,以Cα为旋转点形成右手螺旋,氨基酸残基的侧链基团伸向螺旋的外侧。 (2)每3.6个氨基酸旋转一周,螺距为0.54n
关于蛋白质的二级结构(β折叠)的简介
是蛋白质的二级结构,肽键平面折叠成锯齿状,相邻肽链主链的N-H和C=O之间形成有规则的氢键,在β-折叠中,所有的肽键都参与链间氢键的形成,氢键与β-折叠的长轴呈垂直关系。 60年代以来,球状蛋白质的晶体结构被陆续解出,发现许多蛋白质中都有β-折叠层,平行的和反平行的都有。有时候许多段肽链排列成
关于蛋白质二级结构的Ω环的介绍
Ω环(Ω loop)是近二三十年才发现的一类二级结构,它们虽然不像α螺旋和β折叠片那样规正,但仍有规则可循,属干部分规正的二级结构。从形式上Ω环可看成是β转角的延伸。此环有两个特征。一是环的长度不超过16个氨基酸残基,一般为6~8个残基,尤以8残基的Ω环为最多;二是它改变了蛋白质肽链的走向,使得
关于蛋白质二级结构β-片层结构特点的内容介绍
①蛋白质二级结构β-片层结构特点—是肽链相当伸展的结构,肽链平面之间折叠成锯齿状,相邻肽键平面间呈110°角。氨基酸残基的R侧链伸出在锯齿的上方或下方。 ②蛋白质二级结构β-片层结构特点—依靠两条肽链或一条肽链内的两段肽链间的C=O与N-H形成氢键,使构象稳定。 ③蛋白质二级结构β-片层结构
构建“整合AIR的序列和结构特征,预测免疫反应”学习框架
适应性免疫受体(AIR,包括 T 细胞受体,TCR;B 细胞受体,BCR)与其同源抗原之间的结构对接是适应性免疫中最基本的过程之一。然而,目前预测 AIR-抗原结合的方法很大程度上依赖于 AIR 的序列衍生特征,忽略了结合亲和力所必需的结构特征。 腾讯 AI Lab 的研究人员提出了一个名为
Meta公司AI预测6亿蛋白质结构
ESM宏基因组图谱数据库包含6.17亿个蛋白质的结构预测。图片来源:ESM宏基因组图谱 谷歌旗下人工智能(AI)公司Deep Mind今年公布了2.2亿个蛋白质的预测结构,几乎涵盖了DNA数据库中已知生物的所有蛋白质。现在,另一个科技巨头正在填补蛋白质宇宙中的暗物质。 Meta公司(前
蛋白质结构预测和分子动力学
作为结构基因组研究的互补,蛋白质结构预测的目标是发展出有效的能够提供未知结构(未通过实验方法得到)蛋白质的可信的结构模型。目前最为成功的结构预测方法是同源建模;这一方法是利用序列相似的蛋白质(已知结构)的结构作为“模板”。而结构基因组的目标正是通过解析大量蛋白质的结构来为同源建模提供足够的模板
GTAG规则的序列组合特点
这是割裂基因结构上的又一个重要特点。每一个内含子的两端具有广泛的同源性和互补性,5' 端起始的两个碱基是GT,而3' 端最后的两个碱基是AG,通常把这种接头形式叫做GT-AG法则(GT-AG rule)。
蛋白质三级机构(空间结构)预测-从头预测法...1
从头预测模型的基本思想在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法(Abinitio),即(直接)仅仅根据序列本身来预测其结构。在1994年之前,还没有一个从头算方法能够预测蛋白质的空间结构。从那以后,人们陆续提
蛋白质预测分析资料大全
蛋白质预测分析:物理性质预测:Compute PI/MW http://expaxy.hcuge.ch/ch2d/pi-tool.html Peptidemass http://expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp://ftp.vir
关于蛋白质的二级结构(β折叠)的特性介绍
β-折叠(β-sheet)也是一种重复性的结构,大致可分为平行式和反平行式两种类型,它们是通过肽链间或肽段间的氢键维系。可以把它们想象为由折叠的条状纸片侧向并排而成,每条纸片可看成是一条肽链,称为β折叠股或β股(β-strand),肽主链沿纸条形成锯齿状,处于最伸展的构象,氢键主要在股间而不是股
蛋白质超二级结构的基本信息介绍
超二级结构(supersecondary structure)是指在多肽链内顺序上相互邻近的二级结构常常在空间折叠中靠近,彼此相互作用,形成规则的二级结构聚集体。发现的超二级结构有三种基本形式:α螺旋组合(αα);β折叠组合(βββ)和α螺旋β折叠组合(βαβ),其中以βαβ组合最为常见。它们可
从预测进化-AI能“构想”新蛋白质结构
半个世纪以来,科学家一直在寻找解决“蛋白质折叠问题”的方法。这是生物学领域的一项重大挑战,难倒了几代科学家。但现在,人工智能(AI)解决了这一问题。据《自然》杂志1日发表的论文,包括美国华盛顿大学、伦斯勒理工学院和哈佛大学的研究人员在内的研究小组描述了一种升级的阿尔法折叠系统,该系统由深度思维(
直播预告-|-蛋白质结构与功能预测及设计
直播时间:2024年8月22日(周四)19:00——21:40 直播平台:科学网APP(科学网微博直播间链接)https://weibo.com/l/wblive/p/show/1022:2321325069047447289984科学网微博科学网视频号 【直播简介】8月22日(周四)晚19:0
蛋白质三级结构预测-线索化法
线索化模型产生的背景及发展上面已经提到,两个自然进化的蛋白质如果具有30%的等同序列,则它们是同源的蛋白质,具有基本相同的三维结构。那么,其余的是否就不是同源的呢?实际并非如此。在最新的蛋白质数据库PDB中,有上千对蛋白质具有同源的空间结构,但它们的序列等同部分小于25%,即远程同源。许多结构相似的
蛋白质三级机构预测-同源模型化法1
蛋白质结构预测的生物学意义生物信息学研究的一个主要目标是了解蛋白质序列与三维结构的关系,但是序列与结构之间的关系是非常复杂的。人们已经掌握了一些蛋白质序列与二级结构之间的关系,但是对于蛋白质序列与空间结构之间的关系了解得比较少。预测蛋白质的二级结构只是预测折叠蛋白的三维形状的第一步。一些结构不是很规
CD测蛋白质二级结构的基本原理
1. CD测蛋白质二级结构的基本原理 蛋白质是由氨基酸通过肽链组成的具有特定结构的生物大分子。蛋白质中氨基酸残基的排列次序是蛋白质的一级结构,而肽链中局部肽段骨架形成的构象称为二级结构,二级结构是靠台联股价中的烫机上的氧原子和亚胺基上的氢之间的氢键来维系的,根据肽链的旋转方向与氢键之间
蛋白质工程的结构、功能的设计和预测
根据对天然蛋白质结构与功能分析建立起来的数据库里的数据,可以预测一定氨基酸序列肽链空间结构和生物功能;反之也可以根据特定的生物功能,设计蛋白质的氨基酸序列和空间结构。通过基因重组等实验可以直接考察分析结构与功能之间的关系;也可以通过分子动力学、分子热力学等,根据能量最低、同一位置不能同时存在两个
蛋白质结构四个水平二级结构表现纤维蛋白的特
大多数蛋白质可以分为两种主要类型:纤维蛋白(Fibrous proteins)和球蛋白(globular proteins)。纤维蛋白的主要功能是维持和支撑单个的细胞和整个的有机体。a-角蛋白和胶原蛋白是最常见的纤维蛋白,a-角蛋白是毛发和动物尾巴的主要成分,而胶原蛋白是腱、皮肤、骨骼和牙齿的主要蛋
关联tRNA的结构特点
中文名称关联tRNA英文名称cognate tRNA定 义由同一特异氨酰tRNA合成酶识别的所有tRNA。应用学科遗传学(一级学科),分子遗传学(二级学科)