发布时间:2020-03-09 17:49 原文链接: NCBIBLAST软件比对结果详细分析

    NCBI BLAST比对结果报告分析:BLAST是NCBI开发的一款序列相似搜索程,常用在线的BLAST比对工具进行序列比对分析和引物设计。

写在解读报告之前的,首先就使用Blast最终的目的是什么达成一致,Blast是通过两两比对,找到数据库中与输入序列最相似的序列,或者说是最相似的序列片段。那么我们看比对结果就是看Blast从数据库中找到哪些相似的序列,然后就是如何相似,这些相似又可以告诉我们哪些信息等。当然Blast可以衍生出许多的用途,但都是建立在找到相似性序列(片段)的基础上的。

本文以BLASTP为例子,详细说明如何来解读最新的BLAST结果报告。

示例

BLAST地址:

http://blast.NCBI .nlm.nih.gov/Blast.cgi?PROGRAM=blastp&BLAST_PROGRAMS=

blastp&PAGE_TYPE=BlastSearch&SHOW_DEFAULTS=on&LINK_LOC=blasthome

比对用的例子:

>gi|16758036|ref|NP_445782.1| ribosomal protein L21 [Rattus norvegicus]

MTNTKGKRRGTRYMFSRPFRKHGVVPLATYMRIYKKGDIVDIKGMGTVQKGMPHKCYHGKTGRVYNVTQH

AVGIIVNKQVKGKILAKRINVRIEHIKHSKSRDSFLKRVKENDQKKKEAKEKGTWVQLNGQPAPPREAHF

VRTNGKEPELLEPIPYEFMA

数据选择:nr

比对时间:2009年9月9日12:46:23

解读报告前需要掌握的概念

alignments 代表比对上的两个序列

hits 表示两个序列比对上的片段

Score 比对得分,如果序列匹配上得分不一样,减分,分值越高,两个序列相似性越高

E Value 值越小,越可信,相对的一个统计值。

Length 输入序列的长度

Identities 一致性,就是两个序列有多少是一样的

Query 代表输入序列

Subjct 代表数据库中的序列

结果详细说明

菜单与基本信息

NCBI BLAST软件比对结果详细分析

NCBI Blast结果-菜单与基本信息

1.下一步操作的菜单,你可以调整参数,重新比对、保存你的搜索条件以便下次比对、调整报告显示的参数,以更符合你的要求、下载你比对的结果;

2.此次比对的标题,优先是你填写的,如果没有填写可能是你输入fasta序列头(大于号后面的),如果这个也没有找到,NCBI 会自动生成一个;

3.你输入序列的信息,包括标识号、描述信息、类型、长度;

4.数据库的信息以及你选择的Blast程序;

5.查看其他报告,比如摘要、分类、距离树、结构、多重比对等。

Graphic Summary

NCBI BLAST软件比对结果详细分析

Graphic Summary

1.保守域,Blastp时,如果与保守域数据库比对有结果时,方显示;

2.Distribution of 100 Blast Hits on the Query Sequence,图的说明,仔细研读,是hits在输入序列上的分布;

3.这里是消息显示框,当鼠标放在坐标下的横线上,会显示代表的hit的信息;

4.颜色比例尺,代表hit的得分(score)区间,可以简单的理解为红色的线表示有较好的比对结果;

5.输入序列的坐标;

6.每一条线段代表一个hit,在线段上点击,会链接到该hit详细的比对信息部分。

深入理解:由于blast是区段比对,对于给定的两个序列,blast会把具有相识性的片段(hit)找出来,显示的是hit的信息,所以要判断两个序列的相似性,不但要看比对上的片段(hit)的得分,还要看hit覆盖你输入序列的范围,正因为此,这部分图形显示部分就像整个报告的鸟瞰图一样,hit在你输入序列上的分布。本例是一个较短的蛋白质序列,所以不具有代表性,试想如果输入的是M级的核酸序列,你就知道意味着什么了。这里要记住仅仅高分的hit不能说明问题,还要关注hit在输入序列中的位置。

Descriptions

NCBI BLAST软件比对结果详细分析

Descriptions

1.比对上序列的标识符,上面有到该序列详细信息的链接;

2.序列的表述信息,可以知道这个序列功能、基因、物种 等信息;

3.比对得分,由高向低排列,上面有到比对详细信息的链接;

4.E value,由低向高排列;

5.该序列的其他链接,字母表示数据库,比如U表示unigene、G表示Gene数据库;

深入解读:简要的列表形式,便于阅读都比对上了哪些序列,(如果你经验丰富,从score的得分就大致可以判断序列的相似性)序列的相似情况。

Alignments

NCBI BLAST软件比对结果详细分析

Alignments 比对详细信息

1.比对上的序列信息;

2.比对的各种得分,这里不做一一说明,这里我最关注的是Identities,比对上(一致)的数字、一共有多少个,比对上所占的比例。

3.具体的比对序列显示,一目了然,知道了哪些序列比对上了,哪些序列是不一样的,这里也要注意序列的位置关系;

5.复选框,可以选择感兴趣的比对序列,在⑥处进行相应的操作;

6.对选择的序列进行操作,比如下载这些序列、画系统发育树、进行多重比对。

深入解读:blast是以hit为单位显示的结果,分段比对是其核心,所以对于每个hit所显示的信息应当有个深入的理解。至于比对上的情况如何,不要迷信于那些数字,通过序列,你一眼就可以看出来。最后就是注意5、6的操作,可以给你带来很大的便利。

温馨提示:新手可以把Blast工具中的英文概念弄清楚,完全理解后才能事倍功半。此外,也可根据在blast中查找的目的不同做不同的操作,例如:可以把比对序列做多重比对

相关文章

打破依赖:国产饲料工业软件实现弯道超车

19个月100多人团队攻关,8家龙头企业7个月公益性示范试用,认可度100%,服务及时性100%。近日,我国具有自主知识产权的饲料配方工业软件“中农科龙腾”1.0版本正式发布。中农科龙腾软件在大型饲料......

中国科大团队研发“原子算筹”软件,助力新材料研发

中新社合肥7月3日电(记者张俊)由中国科学技术大学量子信息重点实验室、合肥综合性国家科学中心人工智能研究院双聘教授何力新领衔的研究团队近日发布最新一代“原子算筹”(ABACUS)材料计算软件3.7版。......

LCMS,GCMS数据分析软件:多组学分析软件包

     本文内容非商业广告,仅供专业人士参考。关于岛津   岛津企业管理(中国)有限公司是(株)岛津制作所于1999年......

“以赛促教”培养教师骨干

4月29日,湖南科技职业学院软件学院的课堂上,学院老师金莲芳正向评委展示《软件测试技术》课程的教学实施,即参照企业入职标准,针对学情分析和教学目标,遵循软件测试标准工作流程,构建“纵导横驱三堂联动”立......

第三届中国国际软件发展大会在北京召开

4月24日,由中国软件行业协会主办的第三届中国国际软件发展大会在北京召开。《中国科学报》从中国软件行业协会获悉,2024年,恰逢中国软件协会成立四十周年,协会见证了改革开放以来我国软件产业的高速发展,......

全球首款GISLCA软件平台获评国际领先水平

近日,“基于地理信息的生命周期评价软件系统(GIS-LCA软件平台)的研究及应用”科技成果评价会在北京召开,该成果由中国科学院青岛生物能源与过程研究所泛能源大数据与战略研究中心名誉主任、中国工程院院士......

汽车软件相关三项团体标准线下专家评审会顺利召开

2023年10月20日,上海市嘉定区国际汽车质量标准化协会组织召开了《汽车软件质量保证要求》、《汽车软件质量保证规范》、《汽车软件质量保证过程评审》三项团体标准线下专家评审会。会议由国际汽车标准化协会......

顶尖高校必备软件怎么用?快来听资深分析专家分享KnowItAll光谱和化学分析软件

在当今的学术环境下,顶级软件和数据资源是促进学习和科学研究的关键。作为备受信赖的学术合作伙伴,Wiley推出KnowItAll校园解决方案,必将对您的整个科学课程和研究计划产生重大影响。带您获取:光谱......

俄罗斯开发出癌症检测软件,可帮医生早诊断

俄罗斯专家开发出一款软件,能通过非特异症状早期识别癌症。该项目以持续机器学习方法为基础,面向内科医生、助理医师、全科医生及卫生工作者和科研人员。开发人员认为,该软件可提高癌症早期诊断率,从而提高疗效。......

如虎添翼——ProteomeDiscoverer™软件3.1版本重磅发布

软件更新 在正在举行的ASMS2023的会议上,赛默飞世尔公司重磅推出了革命性的OrbitrapAstral质谱仪。而作为一家刚柔并济,均衡发展的公司,本次发布会中,除了在硬件领域有重大突破......