欢迎来到天天文库
浏览记录
ID:55598160
大小:365.21 KB
页数:4页
时间:2020-05-20
《稀疏编码的最近邻填充算法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第32卷第7期计算机应用研究Vo1.32No.72015年7月ApplicationResearchofComputersJu1.2015稀疏编码的最近邻填充算法木苏毅娟,程德波",宗鸣。,李凌孙,朱永华(1.广西师范学院计算机与信息工程学院,南宁530023;2.广西师范大学a.计算机科学与信息工程学院;b.广西多源信息挖掘与安全重点实验室,广西桂林541004;3.广西大学计算机与电子信息学院,南宁530004)摘要:针对K最近邻填充算法(K—nearestneighborimputation,KNNI)的参数K值固定问题进行了研究,发现对缺失值填充时,参数值固定很大程度上影响了填充效
2、果。为此,提出了基于稀疏编码的最近邻填充算法来解决这一问题。该算法是用训练样本重构每一缺失样本,在重构过程中充分考虑了样本之间的相关性;并用范数来学习确保每个缺失样本用不同数目的训练样本填充,以此解决KNNI算法参数值选取问题。基于数据性能分析指标RMSE和相关系数的实验比较结果表明,该算法比KNNI算法的效果要好。该算法能很好地避免了KNNI算法存在的缺陷,适用于数据预处理环节需要对缺失值进行填充的应用领域。关键词:缺失值填充;稀疏编码;重构;均方根误差;相关系数;数据预处理中图分类号:TP181;TP301.6文献标志码:A文章编号:1001.3695(2015)07.194204do
3、i:10.3969/j.issn.1001—3695.2015.07.005K—nearestneighborimputationbasedonsparsecodingSuYijuan,ChengDebo,,ZongMing,,LiLing·,ZhuYonghua(1.CollegeofComputer&InformationEngineering,GuangxiTeachersEducationUniversity,Nanning530023,China;2.a.SchoolofComputerScience&InformationEngineering,b.GuangxiKeyo,yo
4、fMulti—sourceInformationMining&Security,GuangxiNormalUniversity,GuilinGuangxi541004,China;3.SchoolofComputer&ElectronicsInformation,GuangxiUniversity,Nanning530004,China)Abstract:AimedattheparameterKfixedissuesofK—nearestneighborimputation(KNNI)algorithm,itwasf0undthatwhenimputethemissingvalues,th
5、efixedvalueoftheparameterKresuhedinalargeextentinfluencetotheimputationeffect.Therefore,thispaperproposedtheK—nearestneighborbasedonsparsecoding(KNNI—SC)algorithmtosolvethisproblem.Thismethodreconstructedeachmissingsamplewiththetrainingsamptes,fullyconsideringthecorrelationbetweensamplesintherecon
6、structionprocess.Anditusedan1nornltolearntoensureeachmissingsamplewasimputedbydifferentnumberoftrainingsamples,soitsolvedtheparameterKselectionproblemofKNNIalgorithm.PerformancecomparisonbasedonthedataanalysisoftheexperimentalresultsindicatorsRMSEandcorrelationcoeficientsshowthatthealgorithmisbett
7、erthanKNNIal—gorithm.ThealgorithmcanwellavoidthedefectsofKNNIalgorithm,itisavailabletodatapreprocessingstepthatneedsmiss—ingvaluesimputation’sapplications.Keywords:missingvalueimputation;sparsecoding;reconstruct;
此文档下载收益归作者所有