《BLAST数据库检索》PPT课件

《BLAST数据库检索》PPT课件

ID:36428696

大小:1.17 MB

页数:90页

时间:2019-05-09

《BLAST数据库检索》PPT课件_第1页
《BLAST数据库检索》PPT课件_第2页
《BLAST数据库检索》PPT课件_第3页
《BLAST数据库检索》PPT课件_第4页
《BLAST数据库检索》PPT课件_第5页
资源描述:

《《BLAST数据库检索》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、回顾——数据库搜索互联网上存放大量免费的生物学数据库,并有基本的数据分析工具。NCBI包含生物大分子序列的各种最基本数据库。Entrez是NCBI的检索系统,提供关键词检索功能,可检索该网站所有的子数据库。参考序列数据库(RefSeq)包括核酸和蛋白质序列,是高质量的非冗余的数据库。GenBank数据格式(GBFF)包含序列大量的相关信息。1/90回顾——双序列比对双序列比对有三种情况:匹配(得分为正),不匹配(蛋白质有保守性问题),空位(罚分)。空位罚分一般采用仿射罚分。双序列比对可以帮助我们发现两条序

2、列一致性位点的百分比,或者保守性位点(蛋白质)的百分比。动态规划法比对两条序列可以获得数学上的最佳值(受打分矩阵影响)。可以进行全局(长度接近)和局部的比对。相似性是查找确认同源序列的最基本步骤。同源序列一般具有统计显著的相似性。2/90课堂练习应用动态规划法算法,打分系统是否对双序列比对结果有影响?为什么?双序列比对的动态规划算法的时间复杂度?用点阵法确认一条rna序列是否具有发夹状结构。点阵法为什么要进行去噪处理,用什么方法?3/90矩阵集合-----PAM-N如,PAM60矩阵用于比较相距60个PA

3、M单位的序列。计算方法是PAM1自乘60次。思考题:经过100次PAM后,是否每个氨基酸都发生了变化?为什么?4/90BLOSUM62模块氨基酸替换矩阵5/90BLOSUM90PAM30低趋异度小鼠和大鼠RBPBLOSUM45PAM240高趋异度小鼠和细菌的lipocalinBLOSUM80PAM120BLOSUM62PAM180相似度越低的序列,在比对的时候,采用PAM矩阵时,后面的数字越大,采用BLOSUM矩阵时,后面的数字越小。6/90序列相似性搜索BLAST7主要内容一、BLAST简介二、BLAS

4、T算法三、BLAST一般使用方法四、BLAST搜索实例8/90一、BLAST简介与意义BLAST(BasicLocalAlignmentSearchTool)allowsrapidsequencecomparisonofaquerysequenceagainstadatabase.TheBLASTalgorithmisfast,accurate,andweb-accessible.9/90网站上的简单说明TheBasicLocalAlignmentSearchTool(BLAST)findsregions

5、oflocalsimilaritybetweensequences.Theprogramcomparesnucleotideorproteinsequencestosequencedatabasesandcalculatesthestatisticalsignificanceofmatches.BLASTcanbeusedtoinferfunctionalandevolutionaryrelationshipsbetweensequencesaswellashelpidentifymembersofgen

6、efamilies.(作业:翻译)10/90BLAST的应用确定直系同源序列或旁系同源序列。如当一个新的细菌基因组被测序后,几千种蛋白质被确定,其中有多少蛋白质是同源的?从这里面预测出的基因中有多少是在GenBank中找不到显著性同源物的?确定哪些蛋白质和基因在特定的物种中出现。植物中是否也存在象RBP这样的脂质运载蛋白?鱼类中是否有反转录酶基因(如HIV-1pol基因)?确定一个DNA或者蛋白质序列身份。如通过芯片实验得到一个感兴趣的基因,那么就可以通过将这个DNA序列在一个蛋白质数据库中进行搜索,来寻

7、找哪些蛋白质与该DNA编码的蛋白质具有相关性。11/90确定一个特定基因或者蛋白质有哪些已经发现的变种。例如,很多病毒都具有极强的突变能力。HIV-1pol有哪些已知的变异体?研究可能存在多种剪接方式的表达序列标签。寻找对于一个蛋白质的功能和/或结构起关键作用的氢键氨基酸残基。发现“新基因”。例如,一个对于全基因组DNA的BLAST搜索可能会发现一个DNA所编码的蛋白质是以前所没有报道过的。12/90数据库搜索相似序列的算法数据库搜索相似序列的基础是序列的相似性比对,就是将查询序列与数据库里面的序列逐一的

8、两两比对分析。由于现在数据库信息量很大,这样简单重复的分析非常耗时。所以开发了一些近似的算法以提高速度,目前使用最广泛的序列对数据库相似性搜索的应用程序是FASTA和BLAST。BLAST算法跟之前讲的动态规划法算法有所不同,处理速度更快。13/90BLAST14/90二、BLAST算法“ThecentralideaoftheBLASTalgorithmistoconfineattentiontosegmentpairstha

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。