欢迎来到天天文库
浏览记录
ID:58146956
大小:556.02 KB
页数:8页
时间:2020-04-25
《基于最小包含球的非静态大数据集的快速分类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第28卷第7期控制与决策2013年7月、,.01.28No.7ControlandDecisionJu1.2013文章编号:1001.o920(2013)07—1065—08基于最小包含球的非静态大数据集的快速分类算法史荧中1,2王士同,王骏,邓赵红(1.江南大学数字媒体学院,江苏无锡214122:2.无锡职业技术学院物联网技术学院,江苏无锡214121)摘要:对于小规模的非静态数据,最近提出的时间自适应支持向量机(TA.SVM)方法表现出良好的性能,它从兼顾局部优化和全局优化的角度同时求解多个子分类器的特性.但对于大数据集
2、,较高的计算代价限制了它的实用性.针对此不足,结合核心向量机(CVM)理论提出了针对非静态大数据集的新颖分类方法,即基于中心约束最小包含球(CCMEB)的TA.CVM,简称CCTA.CVM.该方法具有渐近线性时问复杂度的优点,同时继承了TA.SVM的良好性能.最后通过实验验证了所提出方法的有效性.关键词:数据漂移;非静态大数据集;最小包含球;线性时间复杂度中图分类号:TP181文献标志码:AFastclassificationfornonstationarylargescaledatasetsusingminimalencl
3、osingballSHIYing.zhong,一,WANGShi.tong1WANGJun1DENGZhao.hong1,,(1.SchoolofDigitalMedia,JiangnanUniversity,Wuxi214122,China:2.SchoolofInternetofThings,WuxiInstituteofTechnology,Wuxi214121,China.Correspondent:SHIYing-zhong,E—mail:shiyz@wxit.edu.cn)Abstract:Forsmallsca
4、lenonstationarydatasets,therecently-proposedclassifiertimeadaptivesupportvectormachine(TA-SVM)exhibitsitsgoodperformancewiththedistinctivecharacteristicofsimultaneouslysolvingseveralsubclassifierslocallyandglobally.However,forlargescaledatasets,itshighcomputational
5、costsevemlyweakensitsusefulness.Inorderc0overcomethisshortcoming.anovelclassifiernamedcenter-constrainedminimalenclosingball(CCMEB)basedtimeadaptivecorevectormachine(CCTA—CVMforbrevity)forlargenonstationarydatasetsisproposedbyusingcorevectormachine(CVM)theory.Thisc
6、lassifierhasthemeritofasymptoticlineartimecomplexityandinheritsthegoodperformanceofTA—SVM.Experimentalresultsshowtheeffectivenessoftheproposedclassifier.Keywords:datadrift:largenonstationarydatasets:minimalenclosingball:lineartimecomplexity0引言研究的[3,51,更多的是基于“局部分类器”
7、[2'4,9,1_l6】的在某些应用场合,如大型零售超市、电子商务网思路,即从总体数据中依次选取一定区间(称为滑动站、电信领域服务商或者科研机构等,每天都会产生窗)内的数据先分别求出各予分类器,再进行某种组大量的数据,而且数据特征是随着时间而不断变化的,合.它们的差异主要在于滑动窗的长度如何选取、滑数据的分类模型也会随着时间和地点的不同而变化.动窗内各数据的权重和子分类器的集成等.针对这类不断变化的分类模型问题,Helmbold等【l】2011年,Grinblat等[17】利用支持向量机之间的耦于1994年提出了漂移概念(d
8、riftingconcepts),Widmer合来求解非静态数据的分类问题.他们使用时间自适等【2】于1996年使用了概念漂移(conceptdrift),二者略应支持向量机(TA.SVM)方法求解渐变的子分类器,有不同.前者主要针对缓慢变化型数据,相近的研究其核心思想是求解一个子分类器序
此文档下载收益归作者所有