欢迎来到天天文库
浏览记录
ID:34722177
大小:2.86 MB
页数:46页
时间:2019-03-10
《蛋白质-RNA相互作用预测方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:学校代号:10150UDC:密级:学号:20132258硕士学位论文蛋白质-RNA相互作用预测方法研究Thepredictionmethodsofprotein-RNAinteractions学生姓名:李享云导师:汪颖学科门类:理学专业名称:数学研究方向:生物信息学申请学位级别:硕士论文答辩日期:2016年12月14日学位授予单位:大连交通大学大连交通大学理学硕士学位论文摘要摘要蛋白质和RNA相互作用对于细胞功能的行使具有重要意义。蛋白质和RNA的相互作用在许多关键的细胞生命过程中,如细
2、胞运动、物质转运、染色体复制、转录与翻译、信号转导等,都是必不可少的。近几年,随着蛋白质和RNA复合物实验数据的陆续增加,使得蛋白质和RNA相互作用问题的研究成为当前的一个重要研究课题。蛋白质和RNA相互作用的预测方法主要可以归为两类:一类是实验的方法,另一类是计算的方法。利用实验的方法预测相互作用存在着很多弊端,即耗时又费力,因此利用计算的手段预测相互作用还是比较受欢迎的。利用计算手段预测蛋白质-RNA相互作用,关键在于分类器模型的构建,不同分类器模型性能不尽相同。为了更深入了解不同分类器的分
3、类性能,本文首先分析并比较了朴素贝叶斯、支持向量机(SVM)以及随机森林(RF)这3种分类器,归纳总结它们分类性能的优缺点。其次,本文又利用了相关数据库中普遍存在的蛋白质和RNA的序列信息,鉴别蛋白质和RNA的相互作用。本文基于蛋白质和RNA的序列信息,构建蛋白质-RNA相互作用预测模型。先通过来自PDB的3149个蛋白质和RNA相互作用对,得到的氨基酸三联体-核苷酸的整体倾向性,然后重新定义了一个权重倾向性度量,用来度量单个蛋白质-RNA序列对中三联体-核苷酸相互作用个体倾向性。基于此倾向性以
4、及氨基酸三联体和核苷酸成分特征构建预测模型。为了避免特征的冗余性,利用特征选取方法选取显著性特征。通过比较,计算结果证实了本文中预测模型(SVM模型和RF模型)和算法的有效性和可行性。针对同一组数据集,利用同样的预测方法进行预测,有效的计算结果进一步证实了我们构建的三联体-核苷酸的个体倾向性度量特征在蛋白质-RNA相互作用预测中发挥着重要的作用。关键词:蛋白质-RNA相互作用;分类器;分类性能;相互作用倾向性;SVM;随机森林I大连交通大学理学硕士学位论文AbstractProtein-RNAi
5、nteractionsalwaysplayedakeyroleinthecellularfunctions.Manycriticalcellularprocesses,suchascellmotility,materialtransport,chromosomereplication,transcriptionandtranslation,signaltransductionandsoon,areessentialforprotein-RNAinteractions.Withtheincreas
6、eoftheexperimentaldataofprotein-RNAcomplexesinrecentyears,thepredictionofprotein-RNAinteractionsbecomesanurgentandimportantissueatpresent.Thepredictionmethodsofprotein-RNAinteractionshavebeenmainlydividedintotwocategories:oneisthecomputationalmeans,a
7、ndtheotheristheexperimentalmeans.Therearemanydisadvantagesinpredictingtheinteractionbyusingexperimentalmeans,timeconsumingandlaborious,sothecomputationalmeansarewelcomeforpredictingtheprotein-RNAinteractions.Forpredictingtheprotein-RNAinteractionsbyu
8、tilizingthecomputationalmeans,thekeyproblemliesintheconstructionofclassifiermodels.Theperformanceofclassificationisdifferentfordifferentclassifiers.Inordertofurtherunderstandtheclassificationperformanceofdifferentclassifiers,thispaperfirstsummarizest
此文档下载收益归作者所有