【实验目的】
1、掌握蛋白质序列检索的操作方法;
2、熟悉蛋白质基本性质分析;
3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测;
4、了解蛋白质结构预测。
【实验内容】
1、使用Entrez或SRS信息查询系统检索人脂联素(adiponectin)蛋白质序列;
2、使用BioEdit软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析;
3、对人脂联素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析;
4、对人脂联素蛋白质序列进行motif结构分析;
5、对人脂联素蛋白质序列进行二级结构和三维结构预测。
【实验方法】
1、人脂联素蛋白质序列的检索:
(1)调用Internet浏览器并在其地址栏输入Entrez;
(2)在Search后的选择栏中选择protein;
(3)在输入栏输入homo sapiens adiponectin;
(4)点击go后显示序列接受号及序列名称;
(5)点击序列接受号NP_004788 (adiponectin precursor; adipose most abundant gene transcript 1 [Homo sapiens])后显示序列详细信息;
(6)将序列转为FASTA格式保存(参考上述步骤使用SRS信息查询系统检索人脂联素蛋白质序列);
2、使用BioEdit软件对人脂联素蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析:
打开BioEdit软件→将人脂联素蛋白质序列的FASTA格式序列输入分析框→点击左侧序列说明框中的序列说明→点击sequence栏→选择protein→点击Amino
Acid Composition→查看该蛋白质分子质量和氨基酸组成; 或者选择protein后,点击Kyte & Doolittle
Mean Hydrophobicity Profile→查看该蛋白质分子疏水性水平;
3、人脂联素蛋白质序列的蛋白质同源性分析:
(1)进入NCBI/Blast网页;
(2)选择Protein-protein BLAST (blastp);
(3)将FASTA格式序列贴入输入栏;
(4)点击BLAST;
(5)查看与之同源的蛋白质;
4、人脂联素蛋白质序列的motif结构分析:
(1)进入网页;
(2)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;
(3)点击Scan;
(4)查看分析结果(注意Prosite Profile中的motif information);
5、人脂联素蛋白质序列的二级结构预测:
(1)进入下列蛋白结构预测服务器网址:(The PredictProtein Server);
(2)在You can栏点击default;
(3)填写email地址和序列名称;
(4)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏点击Submit;
(5)从email信箱查看分析结果;
6、人脂联素蛋白质序列的三维结构预测:
(1)进入(SwissModel First Approach Mode)网页;
(2)填写email地址、姓名和序列名称;
(3)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;
(4)点击Send Request;
(5)从email信箱查看分析结果(注:需下载软件入rasmol查看三维图象)。
【作业】
1、提交使用上述软件对人脂联素蛋白质序列进行基本性质分析、同源性分析、motif结构分析以及二级结构和三维结构预测的结果;
2、相互对比结果,说明产生不同结果的原因,总结进行上述分析所需注意的关键事项。
此前,对于帕金森的基础性研究已经发现,α-synuclein(α-突触核蛋白,αS)是一种与帕金森症发生密切相关的蛋白质。当该蛋白在神经细胞内错误折叠会形成路易小体,积累过剩容易损伤神经细胞。这次,来......
减数分裂过程中,配对的同源染色体间要形成拉链状的联会复合体。虽然联会复合体在结构上具有高度保守性,但其蛋白质序列的保守性却很低。目前已鉴定的联会复合体相关蛋白,在真菌、动物和植物之间几乎没有同源性。中......
摘要:本文介绍了蛋白质序列中可能存在的Zipf定律。......
摘要:为了研究蛋白质序列的内在特性,通过非线性预测方法将蛋白质序列和随机序列以及混沌序列进行比较。前期研究可知:每条蛋白质序列的每个特征序列的误差比值(E2D)图具有特异性,和随机序列的E2D图相比具......
摘要:利用相似规则、互补规则和分子识别理论建立一种氨基酸数字编码模型用于研究序列特征、功能预测。给出一种新的基于元胞自动机的蛋白质序列图像生成方法,其优点是考虑了氨基酸前后的相互作用,生成的图像与基因......
摘要:随着蛋白质序列-结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算......
摘要针对现有基于频繁模式的分类算法未考虑完全频繁模式所产生的大量无效序列,提出了一种基于最大频繁序列的蛋白质分类算法,此算法每一类都以独有的最大频繁式作为代表,执行模式裁减和测试数据分类实验表明该算法......
摘要:蛋白质序列的分类是预测新蛋白质序列的结构和功能的重要方法,已有的方法主要基于序列比对或概率后缀树。文章设计一种基于频繁模式的蛋白质序列分类算法CFS,使用每类数据独有的频繁模式代表该类,然后应用......
摘要:蛋白质序列的可视化表示———混沌游戏表示呈现出了分形特征。根据分形的产生机理,用递归迭代函数系统模型模拟了蛋白质序列的混沌游戏,并通过比较递归迭代函数系统的吸引子的不变测度与混沌游戏表示的测度之......
摘要:从氨基酸的物化特性出发,利用物理学中“粗粒化”思想,提出了一种蛋白质序列的分组重量编码方法(EncodingBasedonGroupedWeight,简记为EBGW),并结合组分耦联算法进行结构......