生物信息学实验2、3(1)

生物信息学实验2、3(1)

ID:14037964

大小:361.50 KB

页数:11页

时间:2018-07-25

生物信息学实验2、3(1)_第1页
生物信息学实验2、3(1)_第2页
生物信息学实验2、3(1)_第3页
生物信息学实验2、3(1)_第4页
生物信息学实验2、3(1)_第5页
资源描述:

《生物信息学实验2、3(1)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、实验二在NCBI上进行Blast比对、查询实验目的:熟悉序列比对的数学基础,掌握在NCBI网页上进行BLAST比对、查询技能。设备、软件:装有WinXP、Win2k或Win7操作系统的计算机,同时要求装有两个网页浏览器(IE8、360极速浏览器)。实验内容:在应用方面,BLAST分为三个方向,BLASTAssembleGenomes(在指定的基因组里鉴定同源基因,从而在基因组上实现定位),BasicBLAST(常规BLAST,即在数据库里搜索亲缘性的序列)和SpecializedBLAST(对DNA、蛋白质的序列进行特殊BLAST,以期获得特殊的结构域、

2、引物、抗体、SNP、表达谱、转录谱等),在这三组BLAST中,最常用的是BasicBLAST,它也是实现咨询序列与数据库中所有序列比较的BLAST。通过简单的BLAST练习两条短序列的比对,熟悉两条字符串比对的原理;通过提交序列在数据库中进行BLAST在线比对,掌握在NCBI网页上进行BLAST比对、查询功能。实验步骤:一、两条序列的比对1、先将如下两条序列进行FASTA格式处理CTGTGCGGATTCTTGTGGCTTTGGCCCTATCTTTTCTATGTCCAAGCTGTGCCCATCCAA和CTGTGCGGATTCTTGTGGCTTTGGCCCT

3、ATCTTTTCTATGTCCAAGCTGTGCCCATCCAAAA处理后为:>123CTGTGCGGATTCTTGTGGCTTTGGCCCTATCTTTTCTATGTCCAAGCTGTGCCCATCCAA>456CTGTGCGGATTCTTGTGGCTTTGGCCCTATCTTTTCTATGTCCAAGCTGTGCCCATCCAAAA2、打开IE,进入http://www.ncbi.nlm.nih.gov/,后打开BLAST链接(在主页的右上角的popularresources区域的第一个即是),或直接进入BLAST页面(http://blast.nc

4、bi.nlm.nih.gov/)。3、在“BasicBLAST”中选择“nucleotideBLAST”功能,进入。4、在新页面中,选中“Aligntwoormoresequences”。5、分别将上述FASTA格式化后的两条序列分别置入两个框内,点击“BLAST”按钮,进行比对运算。6、了解各项比对结果的含义,体会其比对原理。7、自己尝试任意两条序列的比对过程。二、将感兴趣的序列与数据库中的序列进行BLAST,步骤如下:1)将感兴趣的序列粘贴到BLAST的输入框中。2)选择一个BLAST程序(blastp,blastn,blastx,tblastx,t

5、blastn)。3)选择一个用于搜索的数据库。4)为搜索和输出格式选择可选参数。这些选项包括选择替换矩阵,过滤复杂度低的序列,以及将搜索范围限制在某些特定的物种中。详见“BLAST使用说明”。1.进入在线NCBIblast界面(http://blast.ncbi.nlm.nih.gov/Blast.cgi)。选择blast特定的物种(如人,小鼠,水稻等),也可以选择blast所有的核酸或蛋白序列。这里以常用的核酸库为例进行操作。2.将FASTA格式的序列粘贴到框内,如:>123CTGTGCGGATTCTTGTGGCTTTGGCCCTATCTTTTCTAT

6、GTCCAAGCTGTGCCCATCCAA之后,在“ChooseSearchSet”部分,选择要比对的数据库,一般是选择“others”,如果已知是人或者鼠的序列,则可以在前二者中选其一。之后,在“ProgramSelection”中选择一种BLAST程序,在BLASTn中提供了三种精度的BLAST程序,分别是高相似度的BLAST(megablast)、中相似度的BLAST(discontiguousmegablast)和低相似度的BLAST(BLASTn),一般默认是megablast。最后按下“BLAST”按钮,运行BLAST程序。3.运行一段时间后

7、,将显示出BLAST结果。先看“GraphicSummary”(简图)。最上面的粗红线表示提交的待搜索序列(Query),在该线上有一个刻度,刻度下的数字表示序列长度。该线上面不同颜色的彩色键(colorkey)代表相似度的大小,大于200分的是以红色显示,通常如果下面出现了红线,就可以判断所提交的序列在数据库中检索到了与其具有较高相似度的片段。注意在本实验中,下面共有多少条红线、粉红线、绿线、蓝线和黑线。4.在“Descriptions”部分,给出了上图显示序列的具体描述,两图之间是一一对应的。和上图一样,分值(Score)越大(表明同源性越高)的序列

8、越往前。此外,E值(E-value)也很重要,E值表示由于随机性造成获得这一联配

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。