蛋白质结构域研究进展简述

蛋白质结构域研究进展简述

ID:38264073

大小:716.84 KB

页数:4页

时间:2019-05-24

蛋白质结构域研究进展简述_第1页
蛋白质结构域研究进展简述_第2页
蛋白质结构域研究进展简述_第3页
蛋白质结构域研究进展简述_第4页
资源描述:

《蛋白质结构域研究进展简述》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、万方数据2叭3年第48卷第3期生物学通报蛋白质结构域研究进展简述木庞尔丽(北京师范大学生命科学学院北京100875)摘要蛋白质是由结构域组成的,结构域是蛋白质结构、功能和进化的单位。结构域通过复制和组合可以形成新的蛋白质.不同结构域间的组合分布并不符合随机模型,而是表现出有些结构域组合能力非常强,有些却很少与其他结构域组合的模式。为了研究结构域的这一组合特性,人们建立了结构域共出现网络。就结构域的定义、常用的结构域数据库以及杂凑性结构域进行了介绍。供感兴趣的初学者参考。关键词结构域结构域数据库杂凑

2、性结构域中国图书分类号:Q一1文献标识码:A蛋白质不但是细胞的重要组成部分。也是生物体功能的载体。蛋白质是由结构域组成的,结构域是蛋白质结构、功能和进化的单位,研究蛋白质的结构域对于理解蛋白质的生物学功能及其进化具有重要的意义。1结构域的定义蛋白质是由结构域组成的,结构域的定义有多种描述:从蛋白质的高级结构角度出发。结构域是指一个紧凑的、独立的空间单位;从序列比较、进化的角度出发,结构域是指在不同的分子中重复出现的、有着高度相似的序列片段。由上述2个描述可以看到.结构域是蛋白质结构和进化的单位,同

3、时还可以看出,对于结构域的定义,有2个层次.一个是基于蛋白质的高级结构.即指高度紧凑的结构单位(如图1所示),如蛋白质结构分类图1蛋白质HCK-HUMAN的三维结构图(PDBcode1qcf)数据库(structuralclassificationofproteins,SCOP)中搜集的数据;另一个是基于蛋白质的一级结构,即可以重复使用的序列片段(如图2所示),如蛋白质家族和结构域数据库(adatabaseofproteinfaIIliliesanddomains,Pfam);在SCOP数据库中,

4、结构域的平均长度为175个氨基酸,在Phm数据库中,结构域的平均长度为145个氨基酸。一般来说小分子的蛋白质是由一个结构域组成。而大分子的蛋白质是由结构域的组合、复制等形成的。图2蛋白质HCK-一HUMAN在Pfam26中的结构域组成对于结构域已经进行了大量的研究,这包括关于结构域的起源,如Lupas等人得出的关于结构域起源的观点.他们认为结构域有可能起源于一些短肽片段的聚结,通过聚结与折叠,蕴含并传承有益功能⋯;关于结构域进化的研究,基于序列分析表明在古细菌、细菌和真核细菌中广泛存在的结构域.它

5、们有着远古的祖先,它们共同的祖先可能存在于3亿前_2]:关于结构域与外显子的关系.“u等人的研究认为无脊椎动物和脊椎动物中外显子和结构域的边界具有重要的相关性,并且生物越复杂,这种相关性越强【3]。2结构域数据库目前.与蛋白质结构域相关的数据库有很多,有的是基于结构信息,有的是基于序列信息而构建起来的。下面介绍4个常用的结构域数据库。}基金项目:国家自然科学基金资助项目(31171235)万方数据2生物学通报2013年第48卷第3期2.1Pf抽数据库Phm(http://pfam.sanger.a

6、c.uk,)[。]数据库。是一个大型的基于多序列比对和隐马尔可夫模型的蛋白质结构域和家族数据库。它由A和B2个部分组成.耽姗A是一个基于通过人工校正过的种子序列进行比对。并使用隐马尔可夫模型进行选择,因此数据质量较高;PhmB来自数据库ADDA(automaticdomaindecompositional印rithm),为算法自动产生,可靠性较Pf抽A差些。雎Hn把蛋白质按结构域分成不同的家族,后来发展中又把结构域按照一定的标准组成clans。它的最新版本班蜘26.0(2011年11月发布)中包含

7、13672个结构域。利用Pfam数据库,Bulian等人发现后生动物蛋白质获得新结构域的主要机制是通过相邻基因融合,进而造成外显子的连接,这种基因的融合是通过非等位同源重组来介导的[引。该研究中,他们首先把蛋白质序列注释为结构域信息,通过基因家族进化树,找到获得结构域的事件,接着对编码这些获得的结构域序列进行分析,发现这些结构域在序列上是2个或更多基因的后代,通过对其插入位置和所包含外显子个数等的研究,最后得到了新结构域获得的主要机制,并在人类基因组中找到了一些例子。2.2SCOP数据库SCOP(

8、http://scop.唧一lIIlb.c锄.ac.uk/scop/)‘6]数据库,是描述已知结构的蛋白质的结构和进化关系的数据库。按照蛋白质结构和进化的关系分成有层次的树,其主要层次是家族(fmily)、超家族(superfamily)、折叠(fold)和类(class)。其中家族是按照序列相似性划分的;如果序列相似性较低,而其结构和功能特性表明它们具有共同的进化祖先,将看作超家族;无论有无共同祖先,只要二级结构单元具有相同的排列和拓扑结构,认为具有相同的折叠;不同的折叠又化分成

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。