dna序列的图形表示与其相似性分析

dna序列的图形表示与其相似性分析

ID:32038414

大小:939.12 KB

页数:36页

时间:2019-01-30

dna序列的图形表示与其相似性分析_第1页
dna序列的图形表示与其相似性分析_第2页
dna序列的图形表示与其相似性分析_第3页
dna序列的图形表示与其相似性分析_第4页
dna序列的图形表示与其相似性分析_第5页
资源描述:

《dna序列的图形表示与其相似性分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、插图2.1(a)DNA的核酸基在3维空间中所对应的4个基向量。(b)刷H.曲线所表示的一条DNA序列(右边所示)的正面透视图。...............2.2ChunLi和JunWang对于DNA序列ATGGTGCACC的3维图形表示曲线2.3DNA序列2维表示的三种独立的正交坐标系统和它们关于.人类伊globin基因第一外显子序列的3种图形表示。.................2.4(a)Guo在xoy坐标系中表示四种核昔酸的4个特殊向量。(b)Cuo的关:l二人类伊globin基因第一外显子序列的图形表示。..............2.5关于人类的局部OBSCN基冈序列

2、(包括18760个碱基对)的全部ACDB一曲线。其中外显子用黑色表示,内含子用灰色表示。...........2.6(a)Yau设计的代表A,G,C,T的4个单位向量。(b)Yau的关于人类和山羊的/,-globin基因第一外显子序列的图彤表示。..............2.7MilanRandic2’j"于DNA序列ATGGTGCACCTGACTCCTGA的4条平行线表示法,4条平行线有24种不同位置排列,我们列出了其中的3种。..2.8基于AGCT,ATCG,ACGT三种向量顺序的DNA序列图形表示,序列为人类的肛globin基因第一外显子的前20个核酸基构成的序列。....

3、..568910121415第一辇前言1.1雩l言隧羞生麓技零季芋澍是分子生穆学技术豹褒速发震,耱学家铜获褥了谗多貔种的大量基因序列。尤其是人类基因缀计划(HGP)实埯酌避⋯步深入,为生物学研究提供了犬赞的人类基因数据,生命科学_己步入后熬困组时代。这样,就需要我们对遮然已有的生物信息进行加工、储存、分配、分析、释读、搜索和恢复。在这种情况下,生物信息学作为⋯门生物学和数学、僚怠科学、计算机科学和系统科学撩交叉豹毅兴学科应运蕊受。疆裁,生物信惑学毫成为整个生命秘学发震的重要鳃袋部分,或黄生禽辩学研究静主要蔻沿。揭示生物分子数据的内涵是生物信息学的长远目标,这些数据之间存在复杂的联系

4、,并黼涵着丰富的生物学知识和生物学规律。掰前生物信息的主要任务是研究生物分子数据的获取、存储、省询,发展数据分析的方法,并开发分析工具和实用软件。同时,生物分子数据类型的不断增多及数据量的不断膨胀又霾遗了生物羲惑擎斡磅究和瘟周。瑷蠢静鼗据源包瑟:DNA,渗残,蛋自蒺穿列,大分子绪稳,鏊溺缱等等。这些数据墩要求我稻不断蕤爨赫瓣生物信息算法和工具。下面我们简单回顾一下生物信息学中常用的几个专谢名词,这些术语将在本文中出现,例如:染色体、DNA、骚自质、DNA序列、序列的相似性等等。读者可以从关予生物信息学导论的书籍(例翔i11)中得到更加深入的引导知识。粢§露分数予缨藏菝中,承载垒耪髂

5、蠹鹰奄遗传魏疆,其毒特臻静生物形态呈丝状或拇状物,台有DNA、蛋岛藏和少量RNA。脱氧核糖核酸(DNA)编码遗传信息的生物大分予,怒染色体的主要他学成分,同时也是组成基因的材料。DNA的结构是由一对多核苷酸链相互盘绕组成的双螺旋。斓种碱基是:腺嘌呤(A),鸟嘌呤(G),胞嘧啶(C)和胸腺嚏啶(T)。自然界中,碱蒸对只有ATi和GC:霹滔单链DNA静碱基序捌可殴扶它的互於链攘蕻瑟寒。DNA分子极为宠大,大缝蠢蔻百万碱基霹《bp)。DNA是邃簧懿分予基础,将遗传攒令从一代传至l下一幸℃。蛋白质鬣自旗是包含一条或多麓的氨基酸链的大分子结构。这些链具有特第一章前言2定的顺序;由蛋白质中基因

6、的核酸基序列所决定。蛋白质通过将一条DNA序列转化为一条氨基酸序列来构成。蛋白质是生命活动中最基本的和最重要的物质,氨基酸是蛋白质的基本单位。DNA序列代表组成DNA的四种核苷酸一腺嘌呤(A),鸟嘌呤(G),胞嘧啶(c),胸腺嘧啶(T)无间隔的排列在一起构成DNA序列。任意长度大于4的一串核苷酸被称作一个序列。倒如序列AGTCTGACCTG。序列的相似性序列的相似(similarity)指一条DNA或蛋白质序列与另一条序列的相似程度。这个程度是有差别的,如两条序列的的相似程度达到30%或60%.在进行序列比较时也经常用到”同源”fhomology)这个概念,需要注意的是两条序列同源

7、足指它们具有共同的祖先,在这个意义。t,无所谓同源的程度,两个序列要么同源,要么不同源.上面我们简短的介绍了生物信息学的知识概论,在最近几年随着生物分子数据库(GenBank/EMBL-Bank/DDBJ)的不断增长,生物信息学的热点问题也不断增加,像基因组比较分析、单‘核酸多态现象、系统生物研究等等。而在这些研究中,序列的比较分析是生物信息学中最基本、最重要的任务,通过序列的比较可以发现生物序列中的功能、结构和进化的信息。序列比较的根本任务是,通过比较生物分子序列,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。