序列相似性和序列对比

序列相似性和序列对比

ID:5277496

大小:282.39 KB

页数:48页

时间:2017-12-07

序列相似性和序列对比_第1页
序列相似性和序列对比_第2页
序列相似性和序列对比_第3页
序列相似性和序列对比_第4页
序列相似性和序列对比_第5页
资源描述:

《序列相似性和序列对比》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、序列比较的生物学基础构成生命的基本单位是蛋白质。而作为在细胞中催化各种化学反应的分子机器的酶,也是蛋白质。另外,细胞的许多结构也是蛋白质组成的。连非蛋白质的构成部分也是由属于蛋白质的酶所催化生产的。一个人体含有大约100,000种不同的蛋白质,正是这100,000种蛋白质的特性及其相互作用使我们无所不能。序列比较的生物学基础蛋白质由20种氨基酸组成的多肽折叠而成。蛋白质由20种不同的氨基酸组成不同长度的聚合体,也称为肽或多肽。由这种线性拓朴结构的聚合体折叠起来产生形状各异的不同蛋白质,不同的形状以及2

2、0种氨基酸的化学特性决定了蛋白质的功能。现代生物学中的一个很主要的概念是,蛋白质的功能特性主要决定于线性多肽链中20种氨基酸的序列。由于大多数蛋白质都是自身折叠而成,所以理论上知道了一个蛋白质的序列后即可推导出其功能。序列比较的生物学基础什么决定蛋白质的氨基酸序列?分子生物学的中心内容就是描述我们从父母获得的遗传信息是如何储存于DNA中,它们是如何被用于复制相同的DNA副本,如何从DNA转录到RNA再翻译到蛋白质的。序列比较的生物学基础DNA由4种脱氧核苷酸组成:ATGC。DNA是由4种脱氧核苷酸形成

3、的线性多聚体,这4种核苷酸是:腺嘌呤脱氧核苷单磷酸(deoxyAdenosinemonophosphate,A)、胸腺嘧啶脱氧核苷单磷酸(deoxyThymidinemonophosphate,T)、鸟嘌呤脱氧核苷单磷酸(deoxyGuanosinemonophosphate,G)、胞嘧啶脱氧核苷单磷酸(deoxyCytidinemonophosphate,C)。序列比较的生物学基础RNA则是由A、U、G、C,4种核苷酸形成的相似线性多聚体,这4种核苷酸是:腺嘌呤核苷单磷酸(Adenosinemonop

4、hosphate,A)、尿嘧啶核苷单磷酸(Uridinemonophosphate,U)、鸟嘌呤核苷单磷酸(Guanosinemonophosphate,G)胞嘧啶核苷单磷酸(Cytidinemonophosphate,C)。序列比较的生物学基础遗传密码——三联子mRNA上每3个核苷酸翻译成蛋白质多肽链上的一个氨基酸,这3个核苷酸就称为一个密码,也叫三联子密码。翻译时从起始密码子AUG开始,沿mRNA5’→3’的方向连续阅读直到终止密码子,生成一条具有特定序列的多肽链。mRNA中只有4种核苷酸,而蛋白质

5、中有20种氨基酸,若以一种核苷酸代表一种氨基酸,只能代表4种(4^1=4)。若以两种核苷酸作为一个密码(二联子),能代表4^2=16种氨基酸。而假定以3个核苷酸代表一个氨基酸,则可以有4^3=64种密码,满足了编码20种氨基酸的需要。序列比较的生物学基础4种核苷酸组成64个三联密码子。4种核苷酸可以组成64个不同的三联密码子(tripletcodes),用于编码20种氨基酸绰绰有余。其中三个为终止密码子,代表多肽序列的末端,一种氨基酸可以由1~6个三联密码子编码。由多个密码子编码的氨基酸,不同密码子的使

6、用频率并不相等,这种使用频率的不同分布称为“密码子偏好”(codenusage)。不同种的生物密码子偏好不同。序列比较的生物学基础形成6个开放读码框由于氨基酸是由三联密码子编码的,因此DNA序列就包含三个不同的开放读码框,取决于从第一、第二或第三位核苷酸开始(第四位和第一位同框)。而双链DNA的两条链都可以转录RNA,后者翻译蛋白质。因此,一个DNA序列及其互补链可以有6个不同的读码框(readingframes)。序列比较的生物学基础序列测定。序列测定。可以用化学方法测定蛋白质的氨基酸序列以及DNA

7、和RNA的核苷酸序列。可是,就目前来说,测定DNA的核苷酸序列比测定RNA序列和蛋白质序列容易的多。由于蛋白质序列可以由编码它的DNA序列推导出来,许多已知的蛋白质序列其实就是从DNA序列推导出来的。将mRNA转为DNA(cDNA)是一个简单的实验技术,因此RNA分子的序列通常是以cDNA序列测定的。序列分析其实就是从已知蛋白质、RNA、DNA序列作出生物学推论的过程。序列分析的困难技术欠缺DNA非编码区比编码区多编码区不连续:内含子、外显子mRNA非编码区、tRNA、SnRNA从DNA序列推导

8、蛋白质序列从蛋白质序列推导结构和功能二级结构:alphahelix、betasheet超级二级结构、三级结构、四级结构为什么结构命名如此复杂?结构决定功能、实验方法欠缺蛋白质三级结构推导的基础目前不能从结构推导功能序列分析的困难编码区不连续编码区不连续::内含子、外显子内含子、外显子。。编码蛋白质的DNA并不是连续的,而是在其中分布有许多叫做“内含子”的分隔区。大多数情况下,这个问题可以通过测定mRNA(cDN

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。