实习三:相似序列的数据库搜索

实习三:相似序列的数据库搜索

ID:14276176

大小:45.50 KB

页数:4页

时间:2018-07-27

实习三:相似序列的数据库搜索_第1页
实习三:相似序列的数据库搜索_第2页
实习三:相似序列的数据库搜索_第3页
实习三:相似序列的数据库搜索_第4页
资源描述:

《实习三:相似序列的数据库搜索》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、实习三:相似序列的数据库搜索学号姓名专业年级实验时间提交报告时间实验目的:1.学会使用BLAST在数据库中搜索相似序列2.学会本地运行BLAST(localblast)3.学会分析数据库搜索结果实验内容:依据实验教材学会网页式BLAST的使用,能够使用不同的算法得到与查询蛋白和核酸相似的序列;学会使用本地化BLAST批处理比对大量序列;及通过迭代搜索的方式分析结果,寻找同源序列。作业:1.SearchDNAtopoisomerase1ofyeastontheBLASTserver.ChoosetheBLASTNprogram,answe

2、rthefollowingquestions:检索号:NM_001183260a.Isthereasequenceidenticalasyourqueryintheresult?Whatisthebitscoreandtherawscore?包含原始序列,rawscore为4620,bitscore为4167b.Whatisthescoreformatch,mismatchandgappenalty?匹配2,错配-3,空位引入罚分5,延伸罚分2c.WhatvaluesofKandλwereusedforcalculatingtheexp

3、ectvalues(E)?Wheredothesevaluescomefrom?在搜索结果中的点击“SearchSummary”显示:Lambda0.625;K0.41;K和λ的估计:一些数据库搜索程序,例如FASTA或其它基于Smith-Waterman算法的程序,在进行序列搜索时,会对数据库中的每条序列进行联配并给出联配值,这些值大部分与未知序列无关,但它们被用于了K和λ参数的估计。这一方法避免了随机序列模型因使用真实序列(realsequence)造成的随意性,但同时产生了使用相关序列估计参数的难题。BLAST仅通过部分而不是全部

4、无关序列计算最适联配值,这赢得了搜索速度。因此,对于某一选定的替换矩阵和空位罚值,必须进行K和λ参数的预先估计,估计中使用真实序列,而非通过随机序列模型产生的模拟序列。这一估计的结果看来非常准确。lambda即λ,是BLAST程序的一个统计参数,可以用来进行rawscore(S)与bitscore(S')的转换;来源,根据可观测点突变资料得到的氨基酸相对突变力(mi)和频率fI,氨基酸aj发生变化的概率为1−Mjj,这必须与突变力相一致,即1−Mjj∝mj或按下式定义常数λ:Mjj=1−λmj同样Mjj∝mjAij由于Mjj和ΣMkj之

5、和必为1,Mjj=λmjAij/ΣAkj又因1PAM为100氨基酸中预期发生一次替换,则另外99个氨基酸不发生变化,有99=100ΣfiMiiλ=1/Σ100mifid.Howmanydatabasesequencesweresearched?弹出页面显示出127条序列e.Whatclassesoforganismsdothematchedsequencesoriginatefrom?通过在搜索结果页面中点击TaxonomyReport中查看分布;第一行显示root共71种,这包括:37种Saccharomycetales23种Pezi

6、zomycotina3种Taphrinomycotina7种Endopterygota1种syntheticconstruct2.SearchthePDBdatabasefor“1jfm”andsavethechainAofthissequenceinfastaformatforBLASTPsearch.RuntheBLASTPandanswerthefollowingquestions:在搜索时将数据库限定为PDB时,如上的各种设置在查找结果中可以发现显著地差异:a.Change“Expectthreshold“from10to0.0

7、001,isthereanydifferenceinthesearchresult,why?当算法中的“Expectthreshold”设置为10时,搜索结果为20条;当算法中的“Expectthreshold”为0.0001搜索结果仅为为3条;由此可以看到,ExpectThreshold(E-value值)设置得越小,搜索到的相似序列数目越少,反之则越大。因为这个数值表示仅仅因随机性造成获得这一联配结果的可能次数。这一数值越接近零,发生这一事件的可能性越小。从搜索的角度看,E值越小,联配结果越显著。b.Change“Matrix”fr

8、omBLOSUM62to“PAM30”,isthereanydifferenceintheresult,why?打分矩阵设为“BLOSUM62”时算法中的空位罚分一栏为“引入罚分11延伸罚分1”查找的序列结

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。