基于最小包含球的非静态大数据集的快速分类算法-论文.pdf

基于最小包含球的非静态大数据集的快速分类算法-论文.pdf

ID:58146956

大小:556.02 KB

页数:8页

时间:2020-04-25

基于最小包含球的非静态大数据集的快速分类算法-论文.pdf_第1页
基于最小包含球的非静态大数据集的快速分类算法-论文.pdf_第2页
基于最小包含球的非静态大数据集的快速分类算法-论文.pdf_第3页
基于最小包含球的非静态大数据集的快速分类算法-论文.pdf_第4页
基于最小包含球的非静态大数据集的快速分类算法-论文.pdf_第5页
资源描述:

《基于最小包含球的非静态大数据集的快速分类算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第28卷第7期控制与决策2013年7月、,.01.28No.7ControlandDecisionJu1.2013文章编号:1001.o920(2013)07—1065—08基于最小包含球的非静态大数据集的快速分类算法史荧中1,2王士同,王骏,邓赵红(1.江南大学数字媒体学院,江苏无锡214122:2.无锡职业技术学院物联网技术学院,江苏无锡214121)摘要:对于小规模的非静态数据,最近提出的时间自适应支持向量机(TA.SVM)方法表现出良好的性能,它从兼顾局部优化和全局优化的角度同时求解多个子分类器的特性.但对于大数据集

2、,较高的计算代价限制了它的实用性.针对此不足,结合核心向量机(CVM)理论提出了针对非静态大数据集的新颖分类方法,即基于中心约束最小包含球(CCMEB)的TA.CVM,简称CCTA.CVM.该方法具有渐近线性时问复杂度的优点,同时继承了TA.SVM的良好性能.最后通过实验验证了所提出方法的有效性.关键词:数据漂移;非静态大数据集;最小包含球;线性时间复杂度中图分类号:TP181文献标志码:AFastclassificationfornonstationarylargescaledatasetsusingminimalencl

3、osingballSHIYing.zhong,一,WANGShi.tong1WANGJun1DENGZhao.hong1,,(1.SchoolofDigitalMedia,JiangnanUniversity,Wuxi214122,China:2.SchoolofInternetofThings,WuxiInstituteofTechnology,Wuxi214121,China.Correspondent:SHIYing-zhong,E—mail:shiyz@wxit.edu.cn)Abstract:Forsmallsca

4、lenonstationarydatasets,therecently-proposedclassifiertimeadaptivesupportvectormachine(TA-SVM)exhibitsitsgoodperformancewiththedistinctivecharacteristicofsimultaneouslysolvingseveralsubclassifierslocallyandglobally.However,forlargescaledatasets,itshighcomputational

5、costsevemlyweakensitsusefulness.Inorderc0overcomethisshortcoming.anovelclassifiernamedcenter-constrainedminimalenclosingball(CCMEB)basedtimeadaptivecorevectormachine(CCTA—CVMforbrevity)forlargenonstationarydatasetsisproposedbyusingcorevectormachine(CVM)theory.Thisc

6、lassifierhasthemeritofasymptoticlineartimecomplexityandinheritsthegoodperformanceofTA—SVM.Experimentalresultsshowtheeffectivenessoftheproposedclassifier.Keywords:datadrift:largenonstationarydatasets:minimalenclosingball:lineartimecomplexity0引言研究的[3,51,更多的是基于“局部分类器”

7、[2'4,9,1_l6】的在某些应用场合,如大型零售超市、电子商务网思路,即从总体数据中依次选取一定区间(称为滑动站、电信领域服务商或者科研机构等,每天都会产生窗)内的数据先分别求出各予分类器,再进行某种组大量的数据,而且数据特征是随着时间而不断变化的,合.它们的差异主要在于滑动窗的长度如何选取、滑数据的分类模型也会随着时间和地点的不同而变化.动窗内各数据的权重和子分类器的集成等.针对这类不断变化的分类模型问题,Helmbold等【l】2011年,Grinblat等[17】利用支持向量机之间的耦于1994年提出了漂移概念(d

8、riftingconcepts),Widmer合来求解非静态数据的分类问题.他们使用时间自适等【2】于1996年使用了概念漂移(conceptdrift),二者略应支持向量机(TA.SVM)方法求解渐变的子分类器,有不同.前者主要针对缓慢变化型数据,相近的研究其核心思想是求解一个子分类器序

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。