基于聚类的朴素贝叶斯分类模型的研究与应用

基于聚类的朴素贝叶斯分类模型的研究与应用

ID:33186647

大小:1.57 MB

页数:53页

时间:2019-02-21

基于聚类的朴素贝叶斯分类模型的研究与应用_第1页
基于聚类的朴素贝叶斯分类模型的研究与应用_第2页
基于聚类的朴素贝叶斯分类模型的研究与应用_第3页
基于聚类的朴素贝叶斯分类模型的研究与应用_第4页
基于聚类的朴素贝叶斯分类模型的研究与应用_第5页
资源描述:

《基于聚类的朴素贝叶斯分类模型的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、合肥工业大学硕士学位论文基于聚类的朴素贝叶斯分类模型的研究与应用姓名:张亚萍申请学位级别:硕士专业:计算机应用技术指导教师:胡学钢20061001基于聚类的朴素贝叶斯分类模型的研究与应用摘要分类是数据挖掘领域中重要的研究分支,国内外己经取得了令人瞩目的成就。朴素贝叶斯分类模型由于计算商效、精确度高,并具有坚实的理论基础而得到广泛的应用。然而,朴素贝叶斯分类模型的条件独立性假设和数据的完备性要求限制了对实际数据的应用。借鉴K-means算法,用朴素贝叶斯分类算法来解决分类问题,既能发挥K-means算法的局部搜索能力,又能提高朴素贝叶斯分类的准

2、确度,从而更好地解决分类问题。主要工作如下:1.介绍分析聚类分析中的k—means算法和朴素贝叶斯分类算法;阐述了朴素贝时斯分类的理论基础;讨论几种常见的贝叶斯分类模型。2.将聚类算法引入到朴素贝叶斯分类研究中,提出一种基于聚类的朴素贝叶斯分类算法(CNBC)。用k.means算法对原始数据中的完整数据子集进行聚类,计算缺失数据子集中的每条记录与k个簇重心之间的相似度,把记录赋绘距离最近的一个簇,并用该簇相应的属性均值来填充该记录的缺失值,然后用朴素贝叶斯分类算法对处理后的数据集进行分类。实验结果表明,与朴素贝叶斯分类模型相比,基于聚类的朴素

3、贝叶斯分类模型具有较高的分类准确率。3.基于聚类的朴素贝叶斯分类模型在高校教学管理中的应用。通过用基于聚类的朴素贝叶斯分类算法建立大学生就业/考研预测模型,充分利用往届学生就业、考研的先验知识,指导学生根据自身的条件对以后的道路做出合理地选择。关键词:朴素贝叶斯分类聚类k.means算法学生模型ResearchandApplicationofNaiveBayesianClassificationModelBasedOilClusteringAlgorithmsAbstractTheclassificationisanimportantrese

4、archbranchinthedataminingdomain.Therearemanyamazingachievementshavebeenobtained.Owingtoitshighlyefficienciesandhighlyprecisecalculation,aswellasitsstricttheoreticalfoundation,NaiveBayesianClassifierhasobtainedwidespreadapplication.However,itsconditionindependenceassumptiona

5、ndperfectiondatarequisitionlimititsrealapplication.Thelocalsearchingabilityofk—meansalgorithmisexerted,andthepreciseofNaiveBayesianClassifierimproved.Itcansolveclassificationproblemeffectively.ThemainworkofthedissertationiSasfollows:1.Introducingandanalyzingk-meansalgorithm

6、sofclusteringalgorithmsandNaiveBayesianClassifieralgorithm.ThebasictheoryofNaiveBayesianisstudied,andsomecommonmodelsofNaiveBayesianClassifierarediscussed.2.ANaiveBayesianclassificationbasedonclusteringprinciple(CNBC)byintroducingclusteringalgorithmintoNaiveBayesianclassifi

7、cation.ThesimilaritybetweeneveryrecorderinabsentdatasubsetsandthecentersKclusteriscalculatedbyclusteringcompletedatasubsetsofinitialdatabyk-meansalgorithm,thentherecorderissettothenearestclusterandtheabsentvalueoftherecordisfilledbythecorrespondingattributeofthecluster,fina

8、lly,thehandleddatasetisclusteredbyNaiveBayesianclassificationalgorithm.Theexperime

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。