欢迎来到天天文库
浏览记录
ID:55399696
大小:324.61 KB
页数:5页
时间:2020-05-15
《基于稀疏学习的自适应近邻分类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2015年7月计算机工程与设计July2015第36卷第7期COMPUTERENGINEERINGANDDESIGNVoL36No.7基于稀疏学习的自适应近邻分类算法程德波,苏毅娟,宗呜,朱永华。(1.广西师范大学计算机科学与信息工程学院,广西桂林541004;2.广西师范学院计算机与信息工程学院,广西南宁530023;3.广西大学计算机与电子信息学院,广西南宁530004)摘要:为解决k—NN算法中固定k的选定问题,引入稀疏学习和重构技术用于最近邻分类,通过数据驱动(data-driven)获得k值,不需人为
2、设定。由于样本之间存在相关性,用训练样本重构所有测试样本,生成重构系数矩阵,用z一范数稀疏重构系数矩阵,使每个测试样本用它邻域内最近的k(不定值)个训练样本来重构,解决k-NN算法对每个待分类样本都用同一个k值进行分类造成的分类不准确问题。UCI数据集上的实验结果表明,在分类时,改良k-NN算法比经典NN算法效果要好。关键词:稀疏学习;重构技术;数据驱动;l】一范数;邻域中图法分类号:TP181文献标识号:A文章编号:1000—7024(2015)07—1912—05doi:10.16208/j.issnl00
3、0—7024.2015.07.045Self-adaptiveneighborclassificationbasedonsparselearningCHENGDe-bo,SUYi-juan抖,ZONGMing,ZHUYonghua。(1.CollegeofComputerScienceandInformationTechnology,GuangxiNormalUniversity,Guilin541004,China;2.CollegeofComputerandInformationTechnology,Gua
4、ngxiTeachersEducationUniversity,Nanning530023,China;3.CollegeofComputer,ElectronicsandInformation,GuangxiUniversity,Nanning530004,China)Abstract:TodealwiththeproblemthatNNalgorithmselectsthefixedk,thesparselearningandreconstructiontechniquesfOrclassification
5、wereused。SOthatkvaluewasobtainedthroughdata—drivenwithoutartificialset.DuetOtheexistencecorrela—tionbetweenthesamples,everytestsamplewasusedtOreconstructallthetrainingsamples,reconstructioncoefficientmatrixwasgenerated.TheZ1一normwasusedtOpenalizetheobjective
6、function,SOthateachtestsampleuseditsneighborhoodnearestk(avariablevalue)trainingsamplestOreconstruct,whichsolvedtheproblemofinaccurateclassificationcausedbyk-NNalgo—rithmusingthefixedkvalue.ResultsofexperimentsonUCIdatasetsshowthattheimprovedNNalgorithmisbet
7、terthantheclassica1k-NNalgorithmintermsofclassificationeffect。Keywords:sparselearning;reconstructiontechniquesdata-driven;ll—norm;neighborhood结果并不理想,而且每一个待分类样本都用固定领域大小0引言k最近的已知样本构造的分类器来进行分类,但在实际应通过研究分析,发现k-NN(k-nearestneighbor)算用中每个样本的邻域是不同的,因此每个测试样本应选取法存在邻域
8、大小k难以取定的缺陷,文献[3]提出k一√不同大小的邻域来对其进行分类。结合下面的例子来讨论(数据集样本数n超过100时效果较好),这种取法通常要k-NN算法存在的缺陷。经过大量的实验和分析才能确定合适的k值,通常得到的例如,如图1为一个二类数据集。当k一1时,待分类样收稿日期:20t4—07—12;修订日期:2o14—09—15基金项目:国家自然科学基金项目(61170131、612
此文档下载收益归作者所有