蛋白质-RNA相互作用预测方法研究

蛋白质-RNA相互作用预测方法研究

ID:34722177

大小:2.86 MB

页数:46页

时间:2019-03-10

蛋白质-RNA相互作用预测方法研究_第1页
蛋白质-RNA相互作用预测方法研究_第2页
蛋白质-RNA相互作用预测方法研究_第3页
蛋白质-RNA相互作用预测方法研究_第4页
蛋白质-RNA相互作用预测方法研究_第5页
资源描述:

《蛋白质-RNA相互作用预测方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:学校代号:10150UDC:密级:学号:20132258硕士学位论文蛋白质-RNA相互作用预测方法研究Thepredictionmethodsofprotein-RNAinteractions学生姓名:李享云导师:汪颖学科门类:理学专业名称:数学研究方向:生物信息学申请学位级别:硕士论文答辩日期:2016年12月14日学位授予单位:大连交通大学大连交通大学理学硕士学位论文摘要摘要蛋白质和RNA相互作用对于细胞功能的行使具有重要意义。蛋白质和RNA的相互作用在许多关键的细胞生命过程中,如细

2、胞运动、物质转运、染色体复制、转录与翻译、信号转导等,都是必不可少的。近几年,随着蛋白质和RNA复合物实验数据的陆续增加,使得蛋白质和RNA相互作用问题的研究成为当前的一个重要研究课题。蛋白质和RNA相互作用的预测方法主要可以归为两类:一类是实验的方法,另一类是计算的方法。利用实验的方法预测相互作用存在着很多弊端,即耗时又费力,因此利用计算的手段预测相互作用还是比较受欢迎的。利用计算手段预测蛋白质-RNA相互作用,关键在于分类器模型的构建,不同分类器模型性能不尽相同。为了更深入了解不同分类器的分

3、类性能,本文首先分析并比较了朴素贝叶斯、支持向量机(SVM)以及随机森林(RF)这3种分类器,归纳总结它们分类性能的优缺点。其次,本文又利用了相关数据库中普遍存在的蛋白质和RNA的序列信息,鉴别蛋白质和RNA的相互作用。本文基于蛋白质和RNA的序列信息,构建蛋白质-RNA相互作用预测模型。先通过来自PDB的3149个蛋白质和RNA相互作用对,得到的氨基酸三联体-核苷酸的整体倾向性,然后重新定义了一个权重倾向性度量,用来度量单个蛋白质-RNA序列对中三联体-核苷酸相互作用个体倾向性。基于此倾向性以

4、及氨基酸三联体和核苷酸成分特征构建预测模型。为了避免特征的冗余性,利用特征选取方法选取显著性特征。通过比较,计算结果证实了本文中预测模型(SVM模型和RF模型)和算法的有效性和可行性。针对同一组数据集,利用同样的预测方法进行预测,有效的计算结果进一步证实了我们构建的三联体-核苷酸的个体倾向性度量特征在蛋白质-RNA相互作用预测中发挥着重要的作用。关键词:蛋白质-RNA相互作用;分类器;分类性能;相互作用倾向性;SVM;随机森林I大连交通大学理学硕士学位论文AbstractProtein-RNAi

5、nteractionsalwaysplayedakeyroleinthecellularfunctions.Manycriticalcellularprocesses,suchascellmotility,materialtransport,chromosomereplication,transcriptionandtranslation,signaltransductionandsoon,areessentialforprotein-RNAinteractions.Withtheincreas

6、eoftheexperimentaldataofprotein-RNAcomplexesinrecentyears,thepredictionofprotein-RNAinteractionsbecomesanurgentandimportantissueatpresent.Thepredictionmethodsofprotein-RNAinteractionshavebeenmainlydividedintotwocategories:oneisthecomputationalmeans,a

7、ndtheotheristheexperimentalmeans.Therearemanydisadvantagesinpredictingtheinteractionbyusingexperimentalmeans,timeconsumingandlaborious,sothecomputationalmeansarewelcomeforpredictingtheprotein-RNAinteractions.Forpredictingtheprotein-RNAinteractionsbyu

8、tilizingthecomputationalmeans,thekeyproblemliesintheconstructionofclassifiermodels.Theperformanceofclassificationisdifferentfordifferentclassifiers.Inordertofurtherunderstandtheclassificationperformanceofdifferentclassifiers,thispaperfirstsummarizest

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。