非平衡分类模式下的蛋白质翻译后修饰位点预测研究

非平衡分类模式下的蛋白质翻译后修饰位点预测研究

ID:34653089

大小:1.66 MB

页数:64页

时间:2019-03-08

非平衡分类模式下的蛋白质翻译后修饰位点预测研究_第1页
非平衡分类模式下的蛋白质翻译后修饰位点预测研究_第2页
非平衡分类模式下的蛋白质翻译后修饰位点预测研究_第3页
非平衡分类模式下的蛋白质翻译后修饰位点预测研究_第4页
非平衡分类模式下的蛋白质翻译后修饰位点预测研究_第5页
资源描述:

《非平衡分类模式下的蛋白质翻译后修饰位点预测研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学校代码10408密级研究生学号1520042012硕士学位论文非平衡分类模式下的蛋白质翻译后修饰位点预测研究ResearchonPredictionofProteinpost-translationalmodificationsitesunderimbalanceclassificationmode学位申请人张柳霞导师姓名及职称贾建华副教授专业名称统计学所在学院信息工程学院论文提交日期2018年4月10日学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文

2、中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权××××可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密

3、后适用本授权书。本学位论文属于不保密□。(请在以上相应方框内打“√”)作者签名:日期:年月日导师签名:日期:年月日摘要非平衡数据集分类是机器学习的一个研究热点。传统的分类算法一般适用于平衡数据,因此要挖掘更有效的方法。蛋白质翻译后修饰(Post-TranslationalModification,PTM)是生命体中蛋白质发挥正常功能的重要过程,蛋白质经过生物合成后一般需要适当的翻译后修饰才能给表现正常的生物活性。蛋白质功能位点是对促进蛋白质分子行使其功能的一类残基,其功能位点的识别有助于理解生物学的各种功能意义

4、。本文在非平衡分类模式下对蛋白质翻译后修饰位点进行预测,构造了pSumo-CD和iCar-PseCp的预测模型,提取蛋白质自身序列的特征或结构特征,利用机器学习算法来进行预测,弥补传统方法的不足。类泛素化是一种蛋白质翻译后修饰(PTM)的类型,它在亚细胞运输、转录、DNA修复和信号转导中发挥着重要的作用。研究表明,类泛素化能够促进蛋白质的综合性能。本研究采用了序列耦合的条件概率对数据集进行特征提取,针对非平衡数据集运用协方差判别法(CD)进行了优化,并且开发一个名为pSumo-CD的类泛素化位点预测的在线预测器

5、。通过Jackknife测试得到结果显示模型性能中MCC、Acc、Sn和Sp分别为0.846、97.88%、82.01%和99.21%。与其他的预测器进行分析比较,突显出了本文预测器的优势。羰基化反应是一种翻译后修饰(PTM),识别羰基化修饰位点也是生物学中的一大热点。本文开发一个新型预测器iCar-PseCp,通过结合序列耦合信息与一般伪氨基酸成分提取特征信息,并且使用蒙特卡洛采样(MonteCarlo)扩大正数据集来平衡倾斜的训练数据集。然后使用随机森林算法对其进行分类,10折叠交叉验证结果显示新的预测器明

6、显优于现有的预测器。本文主要还解决非平衡数据集的问题,非平衡分类问题对实验研究具有很重要的意义。本文在现有研究成果基础上,运用新的平衡数据集方法,如协方差判别算法和蒙特卡洛采样,以此来对蛋白质翻译后修饰位点进行预测,从而达到较高的准确率。关键词:翻译后修饰非平衡模式氨基酸特征提取生物信息学IAbstractClassificationofimbalancedatasetsisaresearchhotspotinmachinelearning.Thetraditionalclassificationalgorit

7、hmisgenerallysuitableforbalancingdata,soweneedtoexcavatemoreeffectivemethods.Proteinpost-translationalmodificationisanimportantprocessinwhichproteinplaysanormalfunctioninthelifebody.Afterbiosynthesisofprotein,proteinneedsproperpost-translationalmodificationt

8、oshownormalbiologicalactivity.Proteinfunctionsiteisakindofresiduethatpromotesproteinmoleculestoexercisetheirfunctions.Theidentificationoffunctionalsitescanhelptounderstandthevariousfunctionalsig

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。