使用朴素贝叶斯分类法预测果蝇蛋白质相互作用

使用朴素贝叶斯分类法预测果蝇蛋白质相互作用

ID:33098701

大小:1.52 MB

页数:62页

时间:2019-02-20

使用朴素贝叶斯分类法预测果蝇蛋白质相互作用_第1页
使用朴素贝叶斯分类法预测果蝇蛋白质相互作用_第2页
使用朴素贝叶斯分类法预测果蝇蛋白质相互作用_第3页
使用朴素贝叶斯分类法预测果蝇蛋白质相互作用_第4页
使用朴素贝叶斯分类法预测果蝇蛋白质相互作用_第5页
资源描述:

《使用朴素贝叶斯分类法预测果蝇蛋白质相互作用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海师范大学硕士学位论文使用朴素贝叶斯分类法预测果蝇蛋白质相互作用姓名:李春红申请学位级别:硕士专业:计算机应用技术指导教师:高建华20070401上海师范大学硕士学位论文使用朴素贝叶斯分类法预测果蝇蛋白质相互作用摘要生物信息学(Bioinformatics)是利用计算机技术对在分子生物学等学科研究中的数据进行收集、整理和分析的一门学科。计算机中数据挖掘(Datamining)技术是一个从大量的数据中挖掘知识的过程,是生物信息学中分析数据所需要的工具。蛋白质的相互作用在生命活动过程中起重要作用。本课题选择了数据挖掘中分类问题的一个算法一~朴素

2、贝叶斯分类法来预测黑腹果蝇蛋白质相互作用。蛋白质相互作用预测的方法很多,但在过去的研究中只使用其中的某个方法来预测,而各种方法有一定的偏向性。本文在收集了大量原始数据的基础上,选择了垂直同源性(Ortholog)、共同表达(Co.Expression)、共同生物过程(ShareBiologicalProcess)、富集结构域对(EnrichedDomainPair)作为朴素贝叶斯分类法(NaiveBayesclassifier)的四个属性,这些属性值的估算有各自的算法,本文通过程序实现了这些算法。接着使用阴阳极数据计算果蝇蛋白质相互作用的类条

3、件概率和先验概率。之后根据朴素贝叶斯分类法计算果蝇蛋白质在这四种属性共同作用下相互作用的概率。最后根据得到的数据进行了生物学意义的分析。本文主要使用Java语言实现所有的批量数据处理,使用Mysql数据库存放数据处理的结果。经过本方法处理得到的蛋白质相互作用的数据一方面将对生物实验起到指导作用,另一方面可以对一些未知的蛋白质进行功能注释。本课题所使用的方法对于其他物种的蛋白质相互作用的预测也将有启发作用。关键词:生物信息学,数据挖掘,朴素贝叶斯分类法,蛋白质相互作用上海师范大学硕士学位论文使用朴素贝叶斯分类法预测果蝇蛋白质相互作用Abstra

4、ctBioinformaticsisasubjectwhichUSeScomputertechnologytocollect,integrateandanalyzedataproducedinmolecularbiologyresearch.Datamining(sometimescalledKnowledgeDiscoveryinDatabases)istheprocessofanalyzingdatafromdifferentperspectivesandsummarizingitintousefulinformation,whichis

5、anecessarytoolforbioinformaticsresearch.Protein—proteininteractionplaysimportantrolesinlifeactivity.Inthiswork,weappliedNaiveBayesclassifiertopredictinteractionOddsamongtworandomlyselectedproteinsofDrosophilaMelanogaster.Severalmethodshavebeenusedtopredicttheinteractionbetw

6、eenproteins.Usuallyonlyonemethodwasusedinmostwork,however,thereexistsbiasamongdifferentmethods.Inthisthesis,wechooseOrtholog,Co—Expression,ShareBiologicalProcessandEnrichedDomainPairastheattributesforNaiveBayesclassifieraftercollectinglargeamountoforiginaldata.Theestimation

7、foreachattributehasitsownalgorithmandwehaveimplementedthem.Then,wecalculatetheclass-conditionaloddsandprioroddsfortheProtein—proteininteractionofDrosophilaMefanogasterbyusingGSP(GoldStandardPositive)ihteractionandGSN(GoldStandardNegative)interaction.Afterthat,weuseNaiveBaye

8、sclassifiertocalculatetheInteractionoddsgivenflewpredictiveevidence.Atlast,wefinis

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。