SMwKnn:基于类别子空间距离加权的互k近邻算法.pdf

SMwKnn:基于类别子空间距离加权的互k近邻算法.pdf

ID:56059163

大小:366.00 KB

页数:4页

时间:2020-06-20

SMwKnn:基于类别子空间距离加权的互k近邻算法.pdf_第1页
SMwKnn:基于类别子空间距离加权的互k近邻算法.pdf_第2页
SMwKnn:基于类别子空间距离加权的互k近邻算法.pdf_第3页
SMwKnn:基于类别子空间距离加权的互k近邻算法.pdf_第4页
资源描述:

《SMwKnn:基于类别子空间距离加权的互k近邻算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第41卷第2期计算机科学Vo1.41No.22014年2月ComputerScienceFeb2014SMwKnn:基于类别子空间距离加权的互k近邻算法卢伟胜郭躬德严宣辉陈黎飞(福建师范大学数学与计算机科学学院福州350007)摘要互k最近邻算法(mKnne)是忌最近邻分类算法(Knn)的一种改进算法,该算法用互点最近邻原则对训练样本以及.是最近邻进行噪声消除,从而提高算法的分类效果。然而在利用互k最近邻原则进行噪声消除时,并没有将类别属性考虑进去,因此有可能把真实有效的数据当成噪声消除掉,从而影响分类效果。基于类别子空

2、间距离加权的互志最近邻算法考虑到近邻的距离权重,既能消除冗余或无用属性对最近邻分类算法依赖的相似性度量的影响,又能较好地消除邻居中的噪声点。最后在UCI公共数据集上的实验结果验证了该算法的有效性。关键词类别子空间,互忌最近邻,距离加权,子空间中图法分类号TP391文献标识码ASMwKnn:MutualkNearestNeighboursAlgorithmBasedonClassSubspaceandDistance-weightedLUWei-shengGU0Gong-deYANXuan-huiCHENLifei(Sch

3、oolofMathematicsandComputerScience,FujianNormalUniversity,Fuzhou350007,China)AbstractMknneisanimprovedalgorithmofthe忌nearestneighbours(KNN),whichusesthemutualknearestneigh—bourstoeliminateanomaliesinthetrainingsetandtheknearestneighbours.Ithasthebetterperformance

4、thanKNN.However,therealandeffectivedatamaybeeliminatedasthenoisessothatinfluencingtheefficiencyofclassificationinthenoiseeliminationstagewithouttakingtheclasslabelintoconsideration.Themutualknearestneighboursalgorithmbasedonclasssubspaeeanddistance-weighted(SMwKn

5、n)takingdistance-weightedintoaccountcaneliminatethein—flueneeoftheredundantoruselessattributesonthesimilaritymeasurementoftheknearestneighboursclassifieational—gorithmandeliminatetheanomaliesintheneighbours.TheexperimentalresultsontheUCIpublicdatasetsverifytheeff

6、ectivenessoftheproposedalgorithm.KeywordsClasssubspace,Mutualknearestneighbour,Distanceweighted,Subspacevoting)从这些邻居中选出最具代表性的类别(邻居样本数量1引言最多的类别)作为待分类样本的类别。考虑到距离待分类样分类是机器学习中的一项重要技术,已被广泛应用于各本比较近的邻居样本应该比距离待分类样本比较远的邻居样个领域,比如分本分类领域。胡元等[13提出了一种基于区域本在投票中占有更大的分量,DudaniSA提

7、出了wKnn(The划分的Knn文本快速分类算法,用于提高Knn在文本分类上distance-weighted忌一nearestneighborrule)E5],并且证明了的分类效率。分类算法一般分为急切(eager)和懒惰(1azy)两wKnn算法相比于原始Knn算法具有较低的错误率、更好的种类型[2]。急切类型的分类算法只需建立一次分类模型就可分类表现。不管是Knn还是wKnn,当k取值较小时容易受对待分类样本进行分类,而懒惰类型的分类算法,每当对一个到噪声、离群点的影响,而当k取值较大时又容易受到来自其待分类样本进

8、行分类时需要重新建立分类模型。目前比较常它类别样本的干扰。为了消除噪声数据,LiuHuawen等[6提用的分类算法有k最近邻、决策树、神经网络、贝叶斯分类器、出了mKnnc算法,该算法用互忌最近邻原则对训练样本以及支撑向量机等。k最近邻进行噪声消除,从而提高了算法的分类效果。然而在众多的分类算法中,Knn算法_3]是

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。