基于稀疏学习的自适应近邻分类算法.pdf

基于稀疏学习的自适应近邻分类算法.pdf

ID:55399696

大小:324.61 KB

页数:5页

时间:2020-05-15

基于稀疏学习的自适应近邻分类算法.pdf_第1页
基于稀疏学习的自适应近邻分类算法.pdf_第2页
基于稀疏学习的自适应近邻分类算法.pdf_第3页
基于稀疏学习的自适应近邻分类算法.pdf_第4页
基于稀疏学习的自适应近邻分类算法.pdf_第5页
资源描述:

《基于稀疏学习的自适应近邻分类算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2015年7月计算机工程与设计July2015第36卷第7期COMPUTERENGINEERINGANDDESIGNVoL36No.7基于稀疏学习的自适应近邻分类算法程德波,苏毅娟,宗呜,朱永华。(1.广西师范大学计算机科学与信息工程学院,广西桂林541004;2.广西师范学院计算机与信息工程学院,广西南宁530023;3.广西大学计算机与电子信息学院,广西南宁530004)摘要:为解决k—NN算法中固定k的选定问题,引入稀疏学习和重构技术用于最近邻分类,通过数据驱动(data-driven)获得k值,不需人为

2、设定。由于样本之间存在相关性,用训练样本重构所有测试样本,生成重构系数矩阵,用z一范数稀疏重构系数矩阵,使每个测试样本用它邻域内最近的k(不定值)个训练样本来重构,解决k-NN算法对每个待分类样本都用同一个k值进行分类造成的分类不准确问题。UCI数据集上的实验结果表明,在分类时,改良k-NN算法比经典NN算法效果要好。关键词:稀疏学习;重构技术;数据驱动;l】一范数;邻域中图法分类号:TP181文献标识号:A文章编号:1000—7024(2015)07—1912—05doi:10.16208/j.issnl00

3、0—7024.2015.07.045Self-adaptiveneighborclassificationbasedonsparselearningCHENGDe-bo,SUYi-juan抖,ZONGMing,ZHUYonghua。(1.CollegeofComputerScienceandInformationTechnology,GuangxiNormalUniversity,Guilin541004,China;2.CollegeofComputerandInformationTechnology,Gua

4、ngxiTeachersEducationUniversity,Nanning530023,China;3.CollegeofComputer,ElectronicsandInformation,GuangxiUniversity,Nanning530004,China)Abstract:TodealwiththeproblemthatNNalgorithmselectsthefixedk,thesparselearningandreconstructiontechniquesfOrclassification

5、wereused。SOthatkvaluewasobtainedthroughdata—drivenwithoutartificialset.DuetOtheexistencecorrela—tionbetweenthesamples,everytestsamplewasusedtOreconstructallthetrainingsamples,reconstructioncoefficientmatrixwasgenerated.TheZ1一normwasusedtOpenalizetheobjective

6、function,SOthateachtestsampleuseditsneighborhoodnearestk(avariablevalue)trainingsamplestOreconstruct,whichsolvedtheproblemofinaccurateclassificationcausedbyk-NNalgo—rithmusingthefixedkvalue.ResultsofexperimentsonUCIdatasetsshowthattheimprovedNNalgorithmisbet

7、terthantheclassica1k-NNalgorithmintermsofclassificationeffect。Keywords:sparselearning;reconstructiontechniquesdata-driven;ll—norm;neighborhood结果并不理想,而且每一个待分类样本都用固定领域大小0引言k最近的已知样本构造的分类器来进行分类,但在实际应通过研究分析,发现k-NN(k-nearestneighbor)算用中每个样本的邻域是不同的,因此每个测试样本应选取法存在邻域

8、大小k难以取定的缺陷,文献[3]提出k一√不同大小的邻域来对其进行分类。结合下面的例子来讨论(数据集样本数n超过100时效果较好),这种取法通常要k-NN算法存在的缺陷。经过大量的实验和分析才能确定合适的k值,通常得到的例如,如图1为一个二类数据集。当k一1时,待分类样收稿日期:20t4—07—12;修订日期:2o14—09—15基金项目:国家自然科学基金项目(61170131、612

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。