欢迎来到天天文库
浏览记录
ID:56007661
大小:458.82 KB
页数:7页
时间:2020-06-19
《基于随机子空间的最小最大模块化支持向量机.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第27卷第2期模式识别与人工智能Vo1.27No.22014年2月PR&AIFeb.2014基于随机子空间的最小最大模块化支持向量机木余艺吴家皋李云(南京邮电大学计算机学院南京210023)摘要最小最大模块化支持向量机(M3.SVM)是一种对大规模数据进行模式分类的有效方法.为进一步提高M3.SVM对高维大规模不平衡数据的分类性能,文中分析多种随机子空间策略,并将其与M3-SVM相结合,以实现降维和增加特征层面上的集成机制,从而得到一类基于随机子空间的最小最大模块化支持向量机(M3一SVM—RS).在现实数据集上验证随机子空间策略的有效性,同时通过实验分
2、析M3一SVM—RS中各个子模块(基分类器)之间的差异性.关键词随机子空间(Rs),最小最大模块化支持向量机(M3-SVM),多样性中图法分类号TP39IntegrationofRandomSubspaceandMin·MaxModularSVMYUYi,WUJiao—Gao,LIYun(SchoolofComputerScienceandTechnology,NanjingUniversityofPostsandTelecommunications,Nanfing210023)ABSTRACTThemin—maxmodularsupportvector
3、machine(M3-SVM)isapowerfultoolfordealingwithlarge—SCaledata.ToimprovetheclassificationperformanceofM3.SVMforunblanceddatawithhighdimension.severalrandomsubspacestrategiesareanalyzedandcombinedwithM3.SVMtoreducethedimensionalityandaddtheensemblemechanismonfeatureleve1.ThUS.themin.
4、maxmodularsupportvectormachinewithrandomsubspaceiSproposed.Theexperimentalresultsonrea1worlddatasetsincludingunbalanceddataindicatethattheproposedrandomsubspacestrategyenhancestheclassificationofM3.SVM.Moreover.thediversitybetweensub—modules(baselearner)inM3.SVMisdiscussed.KeyWor
5、dsRandomSubspace(RS),Min-MaxModularSupportVectorMachine(M3-SVM),Diversity国家自然科学基金(No.61073114)、江苏省自然科学基金(No.BK20131378)资助项目收稿日期:2013—05—13作者简介余艺,女,1989年生,硕士研究生,主要研究方向为智能信息处理.E-mail:yy2007915@126.com.吴家皋,男,1969年生,博士,副教授,主要研究方向为大规模数据管理.李云(通讯作者),男,1974年生,博士,教授,主要研究方向为机器学习、模式识别.E—mai
6、l:liyun@njupt.edu.cn.模式识别与人工智能27卷1引言y=f∈{C,C,⋯,C}表示每个样本对应的类别标记.M3.SVM的整个学习过程包括任务分解和MIN—MAX规则集成.如何从大规模数据中挖掘出有用知识是目前的2.1任务分解研究热点.但对于大规模数据,一些传统的简单模式文献[3]中Ln已对类问题的任务分解进行分类技术,如KNN、多层感知机(Multi.1ayerPercep.分析,可通过“一对一”的分解策略将多类问题划分tron,MLP)及SVM等¨J,已无法直接应用.事实表为K(K一1)个二类问题.假设K类中每个类的训练明集成学习是
7、处理大规模数据的一种有效手段J.样本为基于涌现理论和“部分对部分”的样本分解策Jl(略的最小最大模块化支持向量机(Min—MaxModular={’},=1,2,⋯,,∑=,SVM,M3SVM)是处理大规模数据时表现较优其中,x是属于c类的第f个训练样本,t指c类的集成学习方法,目前已应用到专利分类、人脸识含有的训练样本总数.每个二类问题都是独立的,假别、脑电信号处理、语音识别和蛋白质亚细胞定位等设一个为正类(标记为1),一个为负类(标记为领域.一1),并定义为对于大规模数据,M3.SVM通常通过将原始问S={研,1}u{,一1},题划分成许多规模较小的
8、子问题,训练相应的子模i=1,2,⋯,K;m-1,2,⋯,K;i≠.块(基分类器
此文档下载收益归作者所有