构建系统进化树的详细步骤

构建系统进化树的详细步骤

ID:35399254

大小:103.35 KB

页数:8页

时间:2019-03-24

构建系统进化树的详细步骤_第1页
构建系统进化树的详细步骤_第2页
构建系统进化树的详细步骤_第3页
构建系统进化树的详细步骤_第4页
构建系统进化树的详细步骤_第5页
资源描述:

《构建系统进化树的详细步骤》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、构建系统进化树的详细步骤发表于2009-8-607:53:231.建树前的准备工作1.1相似序列的获得——BLASTBLAST是目前常用的数据库搜索程序,它是BasicLocalAlignmentSearchTool的缩写•意为“基本局部相似性比对搜索工具w(Altschuletal・,1990[62];1997[63])°国际著名生物信息中心都提供基于昨b的BLAST服务器。BLAST算:法的基本思路是首先找出检测序列和目标序列之间相似性程度垠高的片段,并作为内核向两端延伸,以找出尽可能长的相似疗列片段。首先登录到提供BLAST服务的常用网站,比如国内的CBI

2、.美国的NCBI.欧洲的EB[刑日本的DDBJ。这些网站提供的BLAST服务在界面上差不藝,但所用的程序有所差异。它们都有一个大的文本框,用于粘贴需耍搜索的序列。把序列以FASTA格式(即第一行为说明行,以“〉”符号开始,后面是序列的名称、说明等,其中“〉”是必需的,名称及说明等可以是任意形式,换行之后是序列)粘贴到那个大的文木框.选择合适的BLAST程序和数据库,就可以开始搜索了。如果足DA序列,-•般选择BLASTN搜索DMA数据库。这里以YCB1为例。登录NCBI主页-点击BLAST-点击Nuc1cotide-nuclootideBLAST(blastn

3、)-在Search文本框中粘贴检测序列-点击BLAST!-点击Format-得到resultofBLAST«BLASTN结果如何分析(参数意义):>gi1281718321gb

4、AY155203.1

5、Nocardiasp.ATCC4987216SribosomalRNAgene,completesequenceScore=2020bits(1019),Expect=0.0Identities=1382/1497(92%),Gaps=8/1497(0%)Strand=Plus/PlusQuery:Igacgaacgctggcggcgtgcttaacacatgcaa

6、gtcgagcggaaaggccctttcgggggt60lllllllllllllllllllllllllllllllllllllllllllllllllllHillSbjct:1gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttcggggt58Query:61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc120iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiminiiiiiiiiiiiiiSbjct:59acac

7、gagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc118Score:指的是提交的序列和捜索出的序列之间的分值,越爲说明越相似;Expect:比对的期望值。比对越好,expect越小,一般在核酸层次的比对,expect小于le-10,就比对很好了,多数惜况下为SIdentities:提交的序列和参比序列的相似性,如上所指为1497个核昔酸中二者有1382个相同;Gaps:一般翻译成空位,指的是对不上的做基数目:Strand:链的方向,Plus/Minus意味着提交的序列利参比序列是反向互补的,如果是Pl

8、us/Plus则二者皆为正向。1.2序列格式:EASTA格式由于EMBL和GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数据格式。FASTA格式又称为Pearson格式,该种序列格式要求序列的标题行以大于号开头,下一行起为具体的序列。一般建议毎行的字符数不超过60或80个,以方便程序处理。藝条核酸和蛋白质序列格式即将该格式连续列出即可,如卞所示:>E.coli1aaattgaagagtttgatcatggctcagattgaacgctggcggcaggcctaacacatgcaa61gtcgaacggtaacaggaagaagctt

9、gcttctttgctgacgagtggcggac>AY631071JiangellagansuensisYIM0021gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt61actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc其中的‘>'为CluslalX默认的序列输入格式,必不可少。•其后可以是种属名称,也可以是序列在Genbank中的登录号(AccessionNo.),自编号也可以.不过需耍注慰名字不能太匕-般山英文字母和

10、数字组成.开首儿个字母最

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。