《序列比对z》word版

《序列比对z》word版

ID:30372001

大小:85.52 KB

页数:10页

时间:2018-12-29

《序列比对z》word版_第1页
《序列比对z》word版_第2页
《序列比对z》word版_第3页
《序列比对z》word版_第4页
《序列比对z》word版_第5页
资源描述:

《《序列比对z》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、序列比对z序列比对zBioinformatics2010-10-2421:18:06阅读0评论0字号:大中小订阅序列比对的基本思想,是找出检测序列和目标序列的相似性。比对过程中需要在检测序列或目标序列中引进空位,以表示插进或删除。序列比对的终极实现,必须依靠于某个数学模型。不同的模型,可以从不同角度反映序列的特性,如结构、功能、进化关系等。很难断定,一个模型一定比另一个模型好,也不能说某个比对结果一定正确或一定错误,而只能说它们从某个角度反映了序列的生物学特性。此外,模型参数的不同,也可能导致比对结果的不同。序列比对的数学模型大体可以分

2、为两类,一类从全长序列出发,考虑序列的整体相似性,即整体比对;第二类考虑序列部分区域的相似性,即局部比对。局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片断组成的,这些部位的序列具有相当大的守旧性,尽管在序列的其它部位可能有插进、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。区分这两类相似性和这两种不同的比对方法,对于正确选择比对方法是十分重要的。应该指出,在实际应用中,用整体比对方法企图找出只有局部相似性的两个序列之间的关系,显然是徒劳的;而用局部比对得到的结果也不能说明这两个序列

3、的三维结构或折叠方式一定相同。BLAST和Fasta等常用的数据库搜索程序均采用局部相似性比对的方法,具有较快的运行速度,而基于整体相似性比对的数据库搜索程序则需要超级计算机或专用计算机才能实现。数据库查询,是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。例如,对蛋白质序列数据库SwissProt输进关键词insulin(胰岛素),即可找出该数据库所有胰岛素或与胰岛素有关的序列条目(Entry)。数据库查询有时也称数据库检索,它和互联网上通过搜索引擎(Searchengine)查找需要的信息是一个概念。数据库搜索在分子

4、生物信息学中有特定含义,它是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。例如,给定一个胰岛素序列,通过数据库搜索,可以在蛋白质序列数据库SwissProt中找出与该检测序列(querysequence)具有一定相似性的序列。因此,在生物信息学中,数据库搜索是专门针对核酸和蛋白质序列数据库而言,其搜索的对象,不是数据库的注释信息,而是序列信息。多序列比对双序列比对是序列分析的基础。然而,对于构成基因家族的成组的序列来说,我们要建立多个序列之间的关系,这样才能揭示整个基因家族的特征。由于可

5、以进步序列比对的信噪比,多序列比对在阐明一组相关序列的重要生物学模式方面起着相当重要的作用。多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。与双序列比对一样,多序列比对的方法建立在某个数学或生物学模型之上。因此,正如我们不能对双序列比对的结果得出"正确或错误"的简单结论一样,多序列比对的结果也没有尽对正确和尽对错误之分,而只能以为所使用的模型在多大程度上反映了序列之间的相似性关系以及它们的生物学特征。目前,构建多序列比对模型的方法大体可以分为两大类。第一类

6、是基于氨基酸残基的相似性,如物化性质、残基之间的可突变性等。另一类方法则主要利用蛋白质分子的二级结构和三级结构信息,也就是说根据序列的高级结构特征确定比对结果。显然,这两种方法所得结果可能有很大差别。一般说来,很难断定哪种方法所得结果一定正确,应该说,它们从不同角度反映蛋白质序列中所包含的生物学信息。基于序列信息和基于结构信息的比对都是非常重要的比对模型,但它们都有不可避免的局限性,由于这两种方法都不能完全反映蛋白质分子所携带的全部信息。我们知道,蛋白质序列是经过DNA序列转录翻译得到的。从信息论的角度看,它应该与DNA分子所携带的信息

7、更为"接近"。而蛋白质结构除了序列本身带来的信息外,还包括经过翻译后加工修饰所增加的结构信息,包括残基的修饰,分子间的相互作用等,终极形成稳定的自然蛋白质结构。因此,这也是对完全基于序列数据比对方法批评的主要原因。显然,假如能够利用结构数据,对于序列比对无疑有很大帮助。不幸的是,与大量的序列数据相比,实验测得的蛋白质三维结构数据实在少得可怜。在大多数情况下,并没有结构数据可以利用,我们只能依靠序列的相似性和一些生物化学特性建立一个比较满足的多序列比对模型。多序列比对的定义为了便于描述,我们对多序列比对过程给出下面的定义。把多序列比对看作

8、一张二维表,表中每一行代表一个序列,每一列代表一个残基的位置。将序列依照下列规则填进表中:(a)一个序列所有残基的相对位置保持不变;(b)将不同序列间相同或相似的残基放进同一列,即尽可能将序列间相同或相似残

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。