欢迎来到天天文库
浏览记录
ID:33995476
大小:1.25 MB
页数:31页
时间:2019-03-03
《两种典型分类算法的改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、漳州师范学院硕士学位论文两种典型分类算法的改进姓名:王福枝申请学位级别:硕士专业:计算机应用技术指导教师:周忠眉2011-06摘要数据挖掘能从大量数据中,提取有用的信息。分类是数据挖掘的重要功能之一,在很多领域得到了广泛的应用,如医疗、保险、金融等。不同的分类方法有各自的优点,同时也存在一定的局限性。对于同样的数据,采用不同的分类方法,得到的准确率可能不同。朴素贝叶斯算法由于算法简单,准确率高而经常被采用。但当属性独立性假设不成立时,有可能导致待测样本类别判断错误,且当待测样本到各类别的概率均相同时,无法判断该待测样本类别。本文针对朴素贝叶斯算法的局限性提出三种
2、改进算法,并在蘑菇数据集上进行实验。实验表明,改进后的算法要比朴素贝叶斯算法准确率高。粗糙集是分类的另一种重要的技术。属性约简是粗糙集理论的一个重要方面。属性约简能在保持知识库的分类和决策能力不变的条件下,删除不相关或不重要的属性。对于给定的信息系统,采用不同的约简算法,将得到不同约简结果。而不同属性约简的准确率往往不相同,一些属性约简结果的分类准确率可能比另一种约简结果的分类准确率低得多。针对这种情况,本文提出基于属性频率和下近似的属性约简算法,并将和其它两种约简算法进行比较。实验表明,本文的属性约简算法的准确率较高。关键词:数据挖掘;分类;朴素贝叶斯算法;粗
3、糙集:属性约简AbstractDataminingextractstheusefulinformationfromalotofdata.Classificationisoneoftheimportantfunctionsofdataminingandhasbeenwidelyusedinmanyfields,suchasmedicaltreatment,insurance,finance.Thedifferentclassificationmethodshavetheiradvantagesanddisadvantages.Thedata’Saccuracyma
4、ybedifferentbyuSiI唱thedifferentclassificationmethodsforthesamedata.Bayesianalgorithmisoftenused,becauseofitssimplealgorithmanditshighaccuracy.Whentheassumptionofattributeindependencedoesnothold,naiveBayesianalgorithmpossiblyleadstomisjudgmentintypesofthewill-be-testedsamples.Whenthew
5、ill-be-testedsampleshavethesameprobabilitiesinallcategories,itisunabletojudgethetypeofSamples.Threeimprovedalgorithmsareproposedforthelimitationsoftheabovealgorithminthispaperandexperimentsaremadeinthemushroomdata.Experimentalresultsshowthattheaccuracyoftheimprovedalgorithmismuchhigh
6、erthantheaccuracyofnaiveBayesianalgorithm.Roughsetisanotherimportanttechnologyofclassification.Theattributereductionisanimportantprobleminroughsettheory.Itcarlmaintaintheclassificationoftheknowledgebaseanddecision-makingonthesameconditions,deletetheirrelevantorunimportantattributes.I
7、tCanreceivedifferentreductionresultsbyusingthedifferentreductionalgorithmsinagiveninformationsystem.Andtheaccuracyofdifferentattributereductionarenotthesameaccuracy,theclassificationaccuracyofsomeattributereductionresultmaybemuchlowerthantheclassificationaccuracyofanotherreduction.In
8、viewofthissi
此文档下载收益归作者所有