资源描述:
《蛋白质磷酸化位点的识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、内蒙古工业大学学报JOURNALOFINNERMONGOLIA第30卷第2期UNIVERSITYOFTECHNOLOGYVol.30No.22011文章编号:1001-5167(2011)03-0081-05*蛋白质磷酸化位点的识别白海艳,吕军,张颖,计美珍,秦丹丹(内蒙古工业大学理学院呼和浩特010051)摘要:磷酸化是蛋白质重要的翻译后修饰之一,磷酸化位点的理论识别是计算生物学的重要研究内容。磷酸化位点附近存在保守残基片段,而这种保守性又与激酶类型相关。选择注释数据相对较多的CK2,PKA和PKC三种激酶催
2、化的磷酸化位点作为研究对象,以序列组分特征,残基位置特异性特征和残基的非近邻关联特征为参数,采用延森-香农离散量(Jensen-ShannonDivergence,JSD)作为各特征差异度量,再使用二次判别分析算法组合不同特征,对磷酸化位点进行预测。对CK2,PKA和PKC三种激酶磷酸化位点7-fold交叉检验,总精度分别达到了90%,90%和86%,这一结果要好于当前其它预测模型。关键词:蛋白质磷酸化位点,延森-香农离散量,二次判别分析中图分类号:Q61文献标识码:A0引言蛋白质翻译后修饰在生命活动中具有十分
3、重要的作用,它使蛋白质的结构更为复杂,功能更为完整,调节更为精细,作用更为专一。常见的蛋白质翻译后修饰过程有六种,如泛素化,磷酸化,糖基化,酯基化,甲基化和乙酰化,其中磷酸化是蛋白质最重要的翻译后修饰之一。蛋白质磷酸化和去磷酸化过程是生物体内普遍存在的信息传导方式,几乎涉及所有的生理及病理过程。真核蛋白质约30%-50%要[1]经历磷酸化过程,而脊椎动物基因组中有5%的基因编码蛋白激酶或磷酸酯酶,激酶的失活会导致一系列的疾病,如癌症等。因此,了解特定蛋白质激酶的磷酸化作用机制将会影响当前分子生物学的许多领域,对
4、疾病的相关研究以及药物设计等方面也都有很大帮助。磷酸化反应是泛指把磷酸基团在酶催化作用下转移到其它化合物的过程,蛋白质的磷酸化则是指在蛋白激酶催化作用下把ATP或GTP的磷酸基转移到底物蛋白质氨基酸残基的过程,其逆转过程是在蛋白磷酸酯酶催化的作用下,脱去磷酸基团的过程。一条蛋白质链的磷酸化一般只发生在丝氨酸(serine,S),苏氨酸(threonine,T)或酪氨酸(tyrosine,Y)这三个残基上。蛋白激酶(proteinkinase,PK)催化氨基酸的侧链羧基形成磷酸酯,蛋白磷酸酯酶催化蛋白质的磷酸酯键
5、而去磷酸化,细胞内任何一种蛋白质的磷酸化状态是由蛋白质激酶和蛋白磷酸酯酶的两种相反酶活性之间的平衡决定的。目前对磷酸化位点的预测有两种技术,一种实验检测,另一种是计算生物学技术。蛋白质磷酸化位点的实验检测技术在不断进步,最早使用的Edman降解法,之后发展到质谱技术,如今,质谱技术和Edman降解合用已经成为蛋白质测序中磷酸氨基酸残基定位的有效工具。关于蛋白收稿日期:2011-01-19*基金项目:内蒙古自然科学基金项目(2010BS0104)作者简介:白海艳,女,硕士研究生通讯作者:吕军,Email:luju
6、n@imut.edu.cn第2期白海艳等蛋白质磷酸化位点的识别109[2]质磷酸化位点检测的实验技术的详细描述可以参见文献。尽管蛋白质组技术的发展异常迅猛,但是对磷酸化蛋白质进行全面详尽地分析仍很困难。其原因主要是:首先,蛋白质磷酸化在体内是一种不稳定的动态过程;其次,磷酸化蛋白质在细胞内丰度较低;再者,磷酸化蛋白质的磷酸基团很容易在分离过程中丢失,且因其负电性而难于质子化。这些均给质谱分析鉴定磷酸化蛋白质造成困难。因此采用计算生物学方法对磷酸化位点预测成为必要的手段。[3]磷酸化位点的计算生物学预测开始于19
7、99年,Blom等给出一个基于神经网络算法的预测模型,直到现在已有十几种预测模型被提出。这些预测方法提取的参数主要有,氨基酸组分特征,氨基酸位置保守性特征,结构功能特征以及氨基酸生化指标特征。主要的机器学习算法有人工神经网络(Artificial[3,4][5,6][7]NeuralNetwork,ANN),支持向量机(SupportVectorMachine,SVM),K近邻,隐马尔可夫[8][9]模型(HiddenMarkovModel,HMM),对数比回归模型(logisticregressionmode
8、ls),位置特异得分[10][11]矩阵(position-specificscoringmatrix,PSSM),信息熵(Information-Entropy),贝叶斯决策理[12][13]论(Bayesiandecisiontheory,BDT),加权投票(weightedvoting)等。2008年Zhang等应用多样[14]性增量结合二次判别分析(IncrementofDiv