欢迎来到天天文库
浏览记录
ID:53274038
大小:231.25 KB
页数:2页
时间:2020-04-17
《蛋白质亚细胞定位预测研究进展.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、Science&TechnologyVision科技视界科技·探索·争鸣蛋白质亚细胞定位预测研究进展郑珊珊石卓兴代琦姚玉华(浙江理工大学生命科学学院,浙江杭州310018)【摘要】蛋白质的功能与其亚细胞位置有着密切的联系,对于确定一个未知特性蛋白质的功能,亚细胞定位研究能够提供重要的参考信息。采用传统实验的方法研究亚细胞定位需要耗费大量的人力、财力、物力,已经不能满足数据库中蛋白质序列爆炸性增长的现实需要。从已积累的知识和数据出发,利用智能算法、机器学.-7等工具开发蛋白质亚细胞定位预测的方法成为了当前的重要研究内容。本文对国内外亚细胞定位预测的研究现状进行了综
2、述。【关键词】亚细胞定位;特征信息提取;预测算法亚细胞定位是指某种蛋白或某种基因表达产物在细胞内的具体低;5)排除样本量太少的亚细胞类别。存在部位.即根据所给出的蛋白质序列来预测其所在的亚细胞位置除了利用SWISS—PROT数据库外。还有LOCATE、TargetP家族数蛋白质是基因功能的执行者.机体中的每一个细胞和所有重要组成部据集等。近年来,随着研究的不断深入,蛋白质序列数据集越来越复杂,分都有它的参与.正是由于它是与生命及与各种形式的生命活动紧密目前最复杂的数据集是酵母蛋白质序列数据集.包含22种亚细胞蛋联系在一起的物质.越来越多的生物学、生物信息学研究者
3、开始对蛋白质。白质的功能预测及分析进行了研究然而.蛋白质只有经分选信号引2蛋白质特征信息的提取导后运输到特定的细胞器中.才能参与细胞的各种生命活动.执行它的功能.如果其运送位置发生偏差.将会影响细胞功能甚至整个生物蛋白质序列特征提取的目的是.从蛋白质序列中提取特征信息.体因此.蛋白质在细胞中的正确定位是细胞系统高度有序运转的前并用适当的数学方法来描述或表示这些信息.使之能正确反映序列与提保障。研究细胞中蛋白质定位的机制和规律预测蛋白质的亚细胞结构或功能之间的关系.这于蛋白质亚细胞定位是至关重要的.也是定位,对于了解蛋白质结构、性质和功能,了解蛋白质之间的相互作用
4、研究蛋白质功能结构的关键根据提取特征信息的不同.可以归纳为研究疾病机理和发展新药物以及探索生命的规律和奥秘具有重要意3类:义。1)基于氨基酸的组成和性质氨基酸组成是一种最基本的序列特随着核酸和蛋白质序列等生物数据的高速膨胀.单纯以传统实验征.也是亚细胞定位预测中使用得最为普遍的一种蛋白质特征信息方法来确定蛋白质亚细胞定位具有成本高、实验时间长.预测精度不蛋白质一般有20种氨基酸组成.氨基酸组成将每种氨基酸在蛋白质理想.会耗费大量的人力和物力等缺点.已经无法满足生命科学研究序列中出现的频率抽取出来作为一个20维的向量1994年.的需要。因此,需要寻找一种快速、有效
5、、准确的计算方法来预测蛋白Nakashima和Nishikawa最早通过利用氨基酸组成进行了蛋白质亚细质亚细胞定位近年来.生物信息学在这方面开展了广泛的研究并且胞定位预测.对细胞内和细胞外蛋白质定位分别取得了88%和84%取得一系列很有意义的成果.数据库的构建和亚细胞定位分析及预测的预测准确率。加速了蛋白质结构和功能的研究一方面.生物信息学研究可以对大2)基于蛋白质序列的N端分选信号的方法一般认为蛋白质在规模的实验数据进行分析和提取生物学信息.同时可以根据现有数据合成的过程中.其N端包含一些特殊的分选信号.这些信号能够指导对一些目前还未知的蛋白质做出预测:另一方
6、面.不断增长的亚细胞新合成的蛋白质分选到特定的亚细胞中,包括信号肽、线粒体转移肽、定位数据也可以用来验证并改进预测结果目前.利用生物信息学方叶绿体运输肽、核定位信号、类囊体腔转移肽和过氧化物酶体定位信法进行蛋白质亚细胞定位预测已成为了一个研究热点号等这种信息的有效性取决于蛋白质序列完整性.一旦蛋白质序列从20世纪9O年代初至今.蛋白质亚细胞定位预测一直是生物信的N端信号不完整或者丢失。预测结果就可能失效息学研究的热点问题之一通过分析国内外研究者的研究方法.不难3)基于功能域和基因注释的方法蛋白质序列在长期的进化过程发现这些方法的主要不同在于两个方面:第一.蛋白质
7、特征信息的提中.某些特定位点上的氨基酸残基具有高度的保守性.这些位点称为取.主要是指将蛋白质相关特征信息提取出之后转化成高维的特征向功能域2002年功能域组分的概念首次被用于蛋白质亚细胞定位.这量.作为预测的输入蛋白质序列特征信息主要包括氨基酸顺序相关种方法显著提高了亚细胞定位的质量2006年.引入GO注释来预测性、氨基酸在蛋白质中出现的频率、氨基酸物理化学性质等。第二,预人类蛋白质的亚细胞位置但是.基于功能与和基因注释的方法对于测算法的设计.根据提取的特征向量集.利用有效的算法预测蛋白质数据库功能注释信息的完善程度依赖性较大.如果数据库中没有足够的亚细胞定位算
8、法影响亚细胞预测精度的重
此文档下载收益归作者所有