knn算法改进及基于all-confidence模式的分类算法探讨

knn算法改进及基于all-confidence模式的分类算法探讨

ID:33728864

大小:652.83 KB

页数:38页

时间:2019-02-28

knn算法改进及基于all-confidence模式的分类算法探讨_第1页
knn算法改进及基于all-confidence模式的分类算法探讨_第2页
knn算法改进及基于all-confidence模式的分类算法探讨_第3页
knn算法改进及基于all-confidence模式的分类算法探讨_第4页
knn算法改进及基于all-confidence模式的分类算法探讨_第5页
资源描述:

《knn算法改进及基于all-confidence模式的分类算法探讨》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、漳州师范学院硕士学位论文KNN算法改进及基于all-confidence模式的分类算法探讨姓名:张玲珠申请学位级别:硕士专业:计算机应用技术指导教师:周忠眉20100601KNN算法改进及基于all-confidence模式的分类算法探讨摘要数据挖掘是从数据库中抽取隐含的、以前未知的、具有潜在应用价值的模型或规则等有用知识的一个复杂过程。分类挖掘是数据挖掘的重要任务之一,它在很多领域得到了广泛的应用,如医学诊断、语音识别、人脸识别、雷达探测等。不同的分类方法都具有自己的优点,也具有一定的局限性,它们都是针对不同的问题而设计的,对于不同的数据得

2、到不同的准确率。本文针对KNN分类算法及基于关联规则的分类算法提出了改进。传统的KNN算法只考虑k个近邻的个数,或k个近邻的平均相似度,当某个类别的近邻样本点个数比较多,但是它与未知样本的相似度都较小,会出现误判,此外不同类别的近邻样本点个数相等或平均相似度一样时,会造成无法判断,因而使得准确率不高。本文提出了KNN分类算法的一种改进,即结合属性值贡献度、平均相似度以及近邻个数的KNN改进算法,并在蘑菇数据集上进行实验结果表明,改进后的KNN分类算法的准确率比传统的k-近邻分类算法的准确率更高。频繁模式挖掘得到的所有模式不都是用户感兴趣的模式

3、,当预先给定的最小支持度阀值太低时,结果模式往往非常大量,从中提取的规则也非常多,且频繁模式中各个属性值之间的关联程度非常小,不能真正反映属性值间的关系。本文提出了基于all-confidence模式的分类算法,该算法不仅考虑了单个属性值的发生,而且考虑了属性值之间的关联,能够找出更有意义的规则用于分类。同样地在蘑菇数据集上进行实验,结果表明,基于all-confidence的模式的分类算法比基于频繁模式的分类算法的准确率更高。关键词:KNN算法;平均相似度;频繁模式;all-confidence模式I漳州师范学院工学硕士学位论文Abstra

4、ctDataminingisacomplexprocesswhichextractstheimplicit,previouslyunknown,valuableandusefulknowledgefromthedatabase.Classificationminingisoneoftheimportanttasksofdatamining,whichhavebeeninwideapplications,suchasmedicaldiagnosis,speechrecognition,facerecognition,radarprobeands

5、oon.Differentclassificationalgorithmswhichweredesignedfordifferentproblemshastheiradvantagesandalsohassomelocations.Theycanabtaindifferentaccuracyfordifferentdata.WeproposesomeimprovementsonKNNandclassificationalgorithmbasedonassociationrules.TraditionalKNNalgorithmsonlycon

6、siderthenumberofnearestneighbors,oraveragesimilarity.Whenthenumberofthenearestneighborswaslarge,butthesimilaritybetweenthesmaplesofthiscategoryandtheunknownsamplewasrelativelysmall,itwillappearthefalsejudgement.Whenthenumberofthenearestneighborsortheaveragesimilaritywasthes

7、ame,itwillbeunabletoabtaintheresult.ThenanimprovedKNNalgorithmbasedoncontributionofattributevalue、averagesimilarityandthenumberofthesimilarsamplesisproposedinthispaper.Weperformtheexperimentsonmushroomdatasets.Theexperimentalresultsshowthatourapproachhashigheraccuracythanth

8、etraditionalK-nearestneighboralgorithm.Notallthepatternsinthefrequentpatternmingin

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。