blast使用经验总结

blast使用经验总结

ID:18278925

大小:88.00 KB

页数:47页

时间:2018-09-16

blast使用经验总结_第1页
blast使用经验总结_第2页
blast使用经验总结_第3页
blast使用经验总结_第4页
blast使用经验总结_第5页
资源描述:

《blast使用经验总结》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、blast使用经验总结blastall-pblastn-i?.fasta-d?.fasta-oout-FF-e1e-10-v20-m8Blast使用方法攻略(一)简介Blast,全称BasicLocalAlignmentSearchTool,即"基于局部比对算法的搜索工具",由Altschul等人于1990年发布。Blast能够实现比较两段核酸或者蛋白序列之间的同源性的功能,它能够快速的找到两段序列之间的同源序列并对比对区域进行打分以确定同源性的高低。Blast的运行方式是先用目标序列建数据库(这种数据库称为database,里

2、面的每一条序列称为subject),然后用待查的序列(称为query)在database中搜索,每一条query与database中的每一条subject都要进行双序列比对,从而得出全部比对结果。Blast是一个集成的程序包,通过调用不同的比对模块,blast实现了五种可能的序列比对方式:blastp:蛋白序列与蛋白库做比对,直接比对蛋白序列的同源性。blastx:核酸序列对蛋白库的比对,先将核酸序列翻译成蛋白序列(根据相位可以翻译为6种可能的蛋白序列),然后再与蛋白库做比对。blastn:核酸序列对核酸库的比对,直接比较核酸序

3、列的同源性。tblastn:蛋白序列对核酸库的比对,将库中的核酸翻译成蛋白序列,然后进行比对。tblastx:核酸序列对核酸库在蛋白级别的比对,将库和待查序列都翻译成蛋白序列,然后对蛋白序列进行比对。Blast提供了核酸和蛋白序列之间所有可能的比对方式,同时具有较快的比对速度和较高的比对精度,因此在常规双序列比对分析中应用最为广泛。可以毫不夸张的说,blast是做比较基因组学乃至整个生物信息学研究所必须掌握的一种比对工具。下载NCBI提供免费下载,网址:ftp://ftp.ncbi.nih.gov/blast/executabl

4、es/release/,可根据自己得机器选择相应操作系统的版本。安装直接解压缩包即可。解压缩命令:zcat*.tar.gz

5、tarxvf-使用Blast的运行分为两个步骤:第一,建立目标序列的数据库;第二,做blast比对。1.运行建库程序formatdb:建库的过程是建立目标序列的索引文件,所用程序是formatdb。程序允许的输入格式FASTA或者ASN.1格式,通常我们使用FASTA格式的序列作为输入。用于建库的FASTA序列是db.seq,formatdb的基本命令是:formatdb-idb.seq[-options]

6、常用的参数有以下几个:-p(T/F):-p参数的意义是选择建库的类型,"T"表示蛋白库,"F"表示核酸库。缺省值为"T"。-o(T/F):-o参数的意义是判断是否分析序列名并建立序列名索引。"T"表示建立序列名索引,"F"表示不建立序列名索引。缺省值为"F"。程序输出:如果建立的是核酸库,输出为db.seq.nhr、db.seq.nin、db.seq.nsq,如果选择了参数"-oT",还会同时输出db.seq.nsd、db.seq.nsi、db.seq.nni、db.seq.nnd。蛋白库和核酸库的输出类似,相应的输出文件为:d

7、b.seq.phr、db.seq.pin、db.seq.psq和db.seq.psd、db.seq.psi、db.seq.pni、db.seq.pnd。除了这些结果,程序还会输出LOG文件(默认为formatdb.log),里面记录了运行时间、版本号、序列数量等信息。几点需要注意的问题:1、建库以后,做blast比对的输入文件就是建库所得的文件db.seq.n**或者db.seq.p**,而不是原始的FASTA序列。也就是说,建库以后,原始的序列文件是可以删除的。2、如果命令行中选择了"-oT",并且目标序列中含有gi号重复的的

8、序列名时,程序会停止建库并报错。例如,下列序列文件中出现了重复的序列名:>gi

9、112385745

10、gb

11、DQ859020.1

12、Oryzasativa(japonicacultivar-group)glutathioneS-transferase2mRNA,completecdsATGGCGGAGGCGGCGGGGGCGGCGGTGGCGCCGGCGAAGCTGGGTCTGTACTCGTACTGGCGGAGCTCGTGCTCGCACCGCGTCCGCATCGCCCTCAACCTCAAAGGATTGGAGTACGAGTACAAGG

13、CGGTGAACCTGCTCAAGGGGGAGCACTCTGATCCAGAATTCATGAAGGTTAATCCTATGAAGTTCGTCCCGGCATTGGTCGAT......CAAGCAGCACTCCCAGACAGACAACCAGATGCCCCTTCCTCT

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。