摘要: 蛋白质的亚细胞定位与蛋白质的功能密切相关, 其定位预测有助于人们了解蛋白质功能。文章提出一种分段伪氨基酸组成成分特征提取方法, 采用支持向量机算法对Chou 构建的两个蛋白质亚细胞定位数据集(C2129, CS2423)进行了分类研究, 并采用总分类精度Q3、内容平衡精度指数Q9 等参数评估预测分类系统性能。预测结果表明, 基于分段伪氨基酸组成成分特征提取方法的预测性能, 优于基于完整蛋白质序列的伪氨基酸组成成分特征提取方法。例如, 基于分段矩描述子伪氨基酸组成成分特征提取方法, 数据集C2129 的Q3 和Q9 分别为84.7% 和60.8%, 比基于完整蛋白质序列的矩描述子伪氨基酸组成成分特征提取方法分别提高1.8 和2.2 个百分点, 且Q3 比现有Xiao 等人的方法提高了9.1 个百分点。基于分段伪氨基酸组成成分特征提取方法构成的特征向量不仅包含残基之间的位置信息, 而且还包含蛋白质子序列之间的耦合信息, 另外蛋白质分段子序列可能和蛋白质的功能域有一定的联系, 从而使这一方法能够有效地预测蛋白质亚细胞定位。
点击这里进入下载页面:

进入下载页面

相关文章

植物蛋白质的亚细胞定位研究进展

摘要:细胞是生命形式的基本组成单元,各种蛋白质按照其功能有序地分布在细胞的每个分区中。植物细胞的主要分区包括细胞膜和其他内膜系统、细胞核、细胞质以及位于其中的线粒体、叶绿体、高尔基体和内质网等各种细胞......

遗传算法2偏最小二乘法用于卵巢癌血清蛋白质组数据的特征挑选

摘要:统计学t检验结合引入的变量筛选方法———遗传算法2偏最小二乘法(GAPLS)对卵巢癌SELDI2TOFMS数据进行特征筛选,从15154个原始变量中筛选得到4个特征质荷比值,采用支持向量机(SV......

泡桐丛枝病发生特异相关蛋白质亚细胞定位及质谱鉴定

摘要:借助胶体金免疫电镜和质谱分析技术,利用制备的专化性抗体,进行豫杂一号泡桐丛枝病发生特异相关蛋白质(m24ku,pI618)叶片和茎尖的亚细胞定位和质谱鉴定研究。结果显示:豫杂一号泡桐丛枝病发生特......

基于支持向量机对肾母细胞瘤患者血清蛋白质标记物的检测分析

【摘要】目的检测肾母细胞瘤患儿血清蛋白质,筛选特异的蛋白质标记物,构建用于肾母细胞瘤早期诊断的血清蛋白质指纹图谱模型。方法应用表面增强激光解析电离飞行时间质谱(SELDI2TOF2MS)技术检测75例......

基于支持向量机的蛋白质名称信息提取技术研究

摘要:基于信息提取理论,采取支持向量机和K近邻两种机器学习方法,对生物医学文献中蛋白质名称提取问题进行了相关研究;结果表明,机器学习方法可以较精确地标示出文章中的蛋白质名称,以支持向量机的效果最好,精......

基于序列剖面和可及表面积的蛋白质相互作用位点的预测

摘要:蛋白质相互作用位点的预测对于突变设计和蛋白质相互作用网络的重构都是至关重要的.由于实验确定的蛋白质复合物和蛋白质配体复合物的结构依然相当少,预测蛋白质相互作用位点的计算方法就显得十分重要.该文提......

基于伪氨基酸和支持向量机的蛋白质亚细胞定位预测

摘要:用电子—离子伪势能(EIIP)对蛋白质序列数字化,经离散傅立叶变换(DFT)后,取5个最高幅值对应的频率和20种氨基酸在序列中所占的百分比组成伪氨基酸。用支持向量机(SVM)方法得到分类的模型,......

基于伪氨基酸和支持向量机的蛋白质亚细胞定位预测

摘要:用电子—离子伪势能(EIIP)对蛋白质序列数字化,经离散傅立叶变换(DFT)后,取5个最高幅值对应的频率和20种氨基酸在序列中所占的百分比组成伪氨基酸。用支持向量机(SVM)方法得到分类的模型,......

血清自体荧光一共振喇曼光谱的小波分析方法

【摘要】本文在介绍激光诱导血清自体荧光一共振喇曼光谱用于癌症诊断的物理学依据的基础上,详细讨论了利用小波理论对激光诱导血清自体荧光一共振喇曼光谱进行分析,提取用于癌症检测与分类特征的方法。......

应用光谱技术和支持向量机分析方法快速检测啤酒糖度和pH值

摘要:为实现啤酒糖度和pH值的快速检测,采用可见/近红外光谱仪器得到360个啤酒样本的可见/近红外光谱数据.使用主成分分析(PCA)对数据进行降维处理以消除众多信息共存中相互重叠的部分,得到6个主成分......