发布时间:2008-10-21 22:46 原文链接: 蛋白质的分组重量编码及在结构型预测的应用

摘要: 从氨基酸的物化特性出发, 利用物理学中“粗粒化”思想, 提出了一种蛋白质序列的分组重量编码方法( Encoding Based onGrouped Weight, 简记为EBGW) , 并结合组分耦联算法进行结构型预测的研究。对标准集T359 中359 个蛋白质的Resubstitution检验和Jack- knife 检验预测准确性分别达到99.72%和91.09%, 其中Jack- knife 检验总体预测精度比相同条件下采用氨基酸组成编码的方法提高了约7%, 特别是!+" 类的预测精度提高了15%。实验结果表明蛋白质序列的EBGW编码方法能够有效地提取字母序列中蕴含的结构信息。
点击这里进入下载页面:

进入下载页面

相关文章

Science揭示“第三杀手”帕金森相关蛋白损伤大脑细节

此前,对于帕金森的基础性研究已经发现,α-synuclein(α-突触核蛋白,αS)是一种与帕金森症发生密切相关的蛋白质。当该蛋白在神经细胞内错误折叠会形成路易小体,积累过剩容易损伤神经细胞。这次,来......

遗传发育所在水稻联会复合体结构研究中取得新进展

减数分裂过程中,配对的同源染色体间要形成拉链状的联会复合体。虽然联会复合体在结构上具有高度保守性,但其蛋白质序列的保守性却很低。目前已鉴定的联会复合体相关蛋白,在真菌、动物和植物之间几乎没有同源性。中......

蛋白质序列中可能存在的Zipf定律

摘要:本文介绍了蛋白质序列中可能存在的Zipf定律。......

用非线性预测方法研究蛋白质序列的特性(Ⅱ)

摘要:为了研究蛋白质序列的内在特性,通过非线性预测方法将蛋白质序列和随机序列以及混沌序列进行比较。前期研究可知:每条蛋白质序列的每个特征序列的误差比值(E2D)图具有特异性,和随机序列的E2D图相比具......

一种新颖的蛋白质序列可视化模型

摘要:利用相似规则、互补规则和分子识别理论建立一种氨基酸数字编码模型用于研究序列特征、功能预测。给出一种新的基于元胞自动机的蛋白质序列图像生成方法,其优点是考虑了氨基酸前后的相互作用,生成的图像与基因......

基于分组重量编码的蛋白质功能预测

摘要:从蛋白质序列出发,采用分组重量编码(EncodingBasedonGroupedWeight,简记EBGW),并结合最近邻居算法对蛋白质功能进行预测。对酵母(Saccharomycescerev......

蛋白质序列中的关联规则发现及其应用

摘要:随着蛋白质序列-结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算......

基于最大频繁序列的蛋白质分类算法

摘要针对现有基于频繁模式的分类算法未考虑完全频繁模式所产生的大量无效序列,提出了一种基于最大频繁序列的蛋白质分类算法,此算法每一类都以独有的最大频繁式作为代表,执行模式裁减和测试数据分类实验表明该算法......

基于频繁模式的蛋白质序列分类

摘要:蛋白质序列的分类是预测新蛋白质序列的结构和功能的重要方法,已有的方法主要基于序列比对或概率后缀树。文章设计一种基于频繁模式的蛋白质序列分类算法CFS,使用每类数据独有的频繁模式代表该类,然后应用......

递归迭代函数系统对detailedHP模型的蛋白质序列的混沌游戏表示的模拟①

摘要:蛋白质序列的可视化表示———混沌游戏表示呈现出了分形特征。根据分形的产生机理,用递归迭代函数系统模型模拟了蛋白质序列的混沌游戏,并通过比较递归迭代函数系统的吸引子的不变测度与混沌游戏表示的测度之......