资源描述:
《blast相似序列的数据库搜索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、实习4:BLAST相似序列的数据库搜索学号20090****姓名******专业年级生命生技****实验时间2012.6.19提交报告时间2012.6.20实验目的:学习使用BLAST在数据库中搜索相似序列实验内容:使用NCBI上面的BLAST程序进行相似性序列搜索:1.把核酸序列利用BLASTN搜索相似核酸序列;2.把蛋白质序列对应的蛋白质利用BLASTP搜索相似蛋白质序列;3.把核酸序列利用BLAST搜索相似蛋白质序列并与BLASTP比较,体会差异:4.把蛋白质序列利用TBLASTN搜索相似核酸序列并与BLASTN比较,体会差异:5.
2、把核酸序列利用TBLASTX搜索相似核酸序列并与BLASTN比较,体会差异。作业:1.找一条你感兴趣的核酸序列(可以是前面搜索到的同源核酸序列中任意一条),通过BLASTN搜索NR数据库,说明你的参数如何设置,分析搜索结果包含哪些信息。答:使用的序列为:智人胰岛素(INS)>gi
3、297374822
4、ref
5、NM_001185098.1
6、Homosapiensinsulin(INS),transcriptvariant3,mRNA。Algorithmparameters设置如下:参数:EnterQuerySequence——NM_0011
7、85098ChooseSearchSet——Database:Nucleoctidecollection(nr);Exclude:√Models(XM/XP),√Uncultured/environmentalamplesequencesProgramSelection——Optimizefot:Highlysimilarsequences展开“Algorithmparameters”,依次设置:GeneralParameters——Maxtargetsequence:100;Shortqueries:√;Expectthreshold:
8、10;Wordsize:28;Maxmatchesinaqueryrange:0ScoringParameters——Matrix/MismatchScores:1,-2;GapCosts:LinearFiltersandMasking——Filter:√Lowcomplexityregions;√Mask:maskforlookuptableonly搜索结果分析:使用智人胰岛素(INS)>gi
9、297374822
10、ref
11、NM_001185098.1
12、Homosapiensinsulin(INS),transcriptvariant3,
13、mRNA搜索NR数据库,搜索出100条符合条件的序列,序列来自的物种包括了Homosapiens,Pantroglodytes,Gorillagorilla,Pongoabelii,Pongopygmaeus,Musmusculus等,其中根据得分高低排列,前7条序列如下所示:NM_001185098.1Homosapiensinsulin(INS),transcriptvariant3,mRNANM_001185097.1Homosapiensinsulin(INS),transcriptvariant2,mRNANM_000207.2
14、Homosapiensinsulin(INS),transcriptvariant1,mRNANG_007114.1Homosapiensinsulin(INS),RefSeqGeneonchromosomeAC132217.15Homosapienschromosome11,cloneRP11-889I17,completesequenceBC005255.1Homosapiensinsulin,mRNAJ00265.1Humaninsulingene,completecds上述序列的“Maxident”均为100%或99%,且E-Va
15、lue值很低,可见搜索出来的序列与QUERY序列匹配的相似度很高。2.将上题中核酸序列对应的蛋白质序列,分别进行BLASTP和PSI-BLAST搜索,说明你的参数设置,简明操作步骤,分析搜索结果,体会PSI-BLAST的优势。答:对应的蛋白质序列为:>gi
16、297374823
17、ref
18、NP_001172027.1
19、insulinpreproprotein[Homosapiens](1)BLASTP搜索简明步骤:在搜索到的NP_001172027.1页面选择“RunBLAST”链接,进入blastp搜索界面,设置合适参数,点击BLAST按钮
20、参数:EnterQuerySequence——NP_001172027.1ChooseSearchSet——Database:Non-redundantproteinsequences(nr)