欢迎来到天天文库
浏览记录
ID:34050876
大小:1.95 MB
页数:70页
时间:2019-03-03
《朴素贝叶斯分类模型的改进研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、厦门大学学位论文原创性声明本人呈交的学位论文是本人在导师指导下,独立完成的研究成果。本人在论文写作中参考其他个人或集体已经发表的研究成果,均在文中以适当方式明确标明,并符合法律规范和《厦门大学研究生学术活动规范(试行)》。另外,该学位论文为()课题(组)的研究成果,获得()课题(组)经费或实验室的资助,在()实验室完成。(请在以上括号内填写课题或课题组负责人或实验室名称,未有此项声明内容的,可以不作特别声明。)声明人(签名):糖也动l牛年歹月7≯日厦门大学学位论燃权使用声明f㈣本人同意厦门大学根据《中华人民共和国学位条例暂行实施办法》等规定保留和使用此学位论文
2、,并向主管部门或其指定机构送交学位论文(包括纸质版和电子版),允许学位论文进入厦门大学图书馆及其数据库被查阅、借阅。本人同意厦门大学将学位论文加入全国博士、硕士学位论文共建单位数据库进行检索,将学位论文的标题和摘要汇编出版,采用影印、缩印或者其它方式合理复制学位论文。本学位论文属于:()1.经厦门大学保密委员会审查核定的保密学位论文,于年月日解密,解密后适用上述授权。(√)2.不保密,适用上述授权。(请在以上相应括号内打“√”或填上相应内容。保密学位论文应是已经厦门大学保密委员会审定过的学位论文,未经厦门大学保密委员会审定的学位论文均为公开学位论文。此声明栏不
3、填写的,默认为公开学位论文,均适用上述授权。)声明人(签名):聋礤月劫lv年厂月/三日摘要分类是数据挖掘中的一个重要课题。分类的目的是为了构造出一个分类函数或者分类模型,这个模型可以将数据库中对应的数据项映射到一个给定的类。数据挖掘的分类一般用在提取描述重要数据类的模型或者预测未来数据趋势。朴素贝叶斯分类模型是当前分类算法的研究热点之一,它具有结构不复杂、分类精度高和速度快等优点。运用该模型进行分类的原理是利用训练集构造出一个分类模型,如果训练集中有存在噪声实例,那么它会降低分类器的性能。本文以优化训练集为研究内容,探讨了基于单属性有效度和结合双属性有效度的朴
4、素贝叶斯分类改进模型,通过自定义的单属性有效度和双属性有效度淘汰数据集中的噪声样本,从而实现训练集优化,提高分类准确率的目标。本文主要工作如下:1、介绍了贝叶斯分类的基本理论和朴素贝叶斯分类模型。2、对几种常用的改进朴素贝叶斯分类模型进行分析:树扩展型贝叶斯分类模型、半朴素贝叶斯分类模型、贝叶斯信念网络分类模型。3、在使用训I练集构建分类器前,基于贝叶斯理论的思想,以单属性为研究对象,通过自定义的单属性有效度淘汰训练集中的噪声实例,实现训练集的优化。4、在基于单属性有效度的改进模型的前提上,结合双属性有效度,发现和淘汰训练集中存在的更多噪声样本,进一步优化训练
5、集。基于大规模数据及大量的实验结果表明:本文提出的改进方法是可行的,而且能有效的提高分类的准确率。关键词:朴素贝叶斯分类模型;单属性有效度;双属性有效度AbstractClassificationisartimportanttaskofdatamining.Thepurposeofclassificationistoconstructaclassificationfunctionorclassificationmodel,whichcanmaptheunclassifiedsampleinthedatabasetoagivenclass.Classificat
6、ioncanbeusedtoextractamodelwhichdescribesimportantdataorpredictsthetrendofdata.NaiveBayesclassificationmodelisoneoftheresearchhotspotsincurrentclassificationalgorithms,andcompared谢thothermethods,NaiveBayesclassificationmodelownsfeaturesofsimplestructure,highclassificationaccuracyand
7、highspeed,etc.TrainingsetisusedinNaiveBayesclassificationmodeltobuildaclassificationmodel,andiftherearenoisesamplesinthetrainingset,theperformanceoftheclassificationwillbereduced.Takenoptimizingthetrainingsetasresearchcomem,improvedNaiveBayesclassificationmodelbasedonvalidityofsingl
8、eattribmeandcombine
此文档下载收益归作者所有