基于序列的人类蛋白磷酸化位点的预测

基于序列的人类蛋白磷酸化位点的预测

ID:17952834

大小:2.70 MB

页数:55页

时间:2018-09-11

基于序列的人类蛋白磷酸化位点的预测_第1页
基于序列的人类蛋白磷酸化位点的预测_第2页
基于序列的人类蛋白磷酸化位点的预测_第3页
基于序列的人类蛋白磷酸化位点的预测_第4页
基于序列的人类蛋白磷酸化位点的预测_第5页
资源描述:

《基于序列的人类蛋白磷酸化位点的预测》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级注1UDC学位论文基于序列的人类蛋白磷酸化位点的预测(题名和副题名)赵亚伟(作者姓名)指导教师林昊研究员电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士学科专业生物物理学提交论文日期2018.04论文答辩日期2018.05.29学位授予单位和日期电子科技大学2018年6月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。PredictionofPhosphorylationSitesinHumanProteinsAMasterThesisSubmittedtoUniversity

2、ofElectronicScienceandTechnologyofChinaDiscipline:BiophysicsAuthor:YaweiZhaoSupervisor:Prof.HaoLinSchool:SchoolofLifeScienceandTechnology摘要摘要蛋白质磷酸化(phosphorylationofprotein)指将腺嘌呤核苷三磷酸(ATP)或鸟嘌呤核苷三磷酸(GTP)的磷酸基团转移到底物蛋白质氨基酸残基上的过程,该过程由蛋白质激酶催化。研究表明,蛋白质磷酸化是蛋白质翻译后修饰

3、方式中最常见的也是最重要的一种类型,参与多种信号传导和细胞代谢通路,在调节生命体活动中发挥着不可替代的作用[1]。如今随着高通量质谱技术的快速发展,蛋白质磷酸化位点数据正在迅速累积,大量高质量的磷酸化位点数据的产生为我们能够系统地研究蛋白质磷酸化位点提供了机会,使得可以快速预测蛋白质磷酸化位点成为可能,构建一个具有准确率高并且鲁棒性强的模型预测蛋白磷酸化位点十分重要。首先,我们从UniProt中收集了经实验验证的人类蛋白质磷酸化数据,去除冗余序列后构建正、负样本集。随后提取并分析磷酸化位点和非磷酸位点周围残基

4、的位点保守性、二级结构和可及性以及氨基酸的物化属性的分布情况。结果发现:磷酸化位点上下文各个位点均较为保守;磷酸化位点上下文各个位点具有更高的可及性以及更加倾向于形成环形结构;磷酸化残基周边位点理化性质的分布的波动幅度要明显大于中性残基样本周边位点;磷酸化位点左侧部分和右侧部分的分布并不具有对称性。而上述这些分析结果均表明了这些物化属性对于磷酸化位点识别的重要性。接下来,基于上述分析结果,我们首先构建了基于不同类别特征的窗口择优策略的磷酸化位点预测模型。Jackknife交叉验证的结果显示,该模型具有良好的表

5、型。其次,鉴于对样本序列位置关联性的考虑我们又构建了一个基于位置关联信息的模型,该模型在三组样本数据集中均表现出了更高的预测性能(auROC)。最终我们将基于位置关联信息的模型构建成了一个在线服务预测器(网址为http://lin-group.cn/server/PhospSitePred/),以供相关研究者使用。关键字:蛋白质磷酸化,特征选择,窗口择优,位置关联,支持向量机IABSTRACTABSTRACTProteinphosphorylationreferstotheprocessoftransferr

6、ingthephosphategroupofadenosinetriphosphate(ATP)orguanosinetriphosphate(GTP)toaminoacidresiduesofaspecifiedprotein,whichiscatalyzedbyproteinkinases.Studieshaveshownthatphosphorylationisthemostcommonandmostimportanttypeofproteinpost-translationalmodification

7、.Itparticipatesinavarietyofsignaltransductionandcellularmetabolicpathwaysandplaysanirreplaceableroleinregulatingtheactivitiesoflivingorganisms.Withtherapiddevelopmentofhigh-throughputmassspectrometrytechnology,proteinphosphorylationsitedataisrapidlyaccumula

8、ting,andalargenumberofaccuratephosphorylationsitedataprovideuswiththeopportunitytosystematicallystudyproteinphosphorylationsites.Therefore,itisveryimportanttobuildamodelwithhighaccuracyandrobustnesstop

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。