欢迎来到天天文库
浏览记录
ID:57925109
大小:829.46 KB
页数:8页
时间:2020-04-14
《使用聚类稳定性分析方法增强单类学习算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2015年4月西安电子科技大学学报(自然科学版)Apr.2015第42卷第2期J0URNAL0FXIDIANUNIVERSITYVo1.42NO.2doi:10.3969/j.issn.1001—2400.2015.02.010使用聚类稳定性分析方法增强单类学习算法刘家辰,苗启广,宋建锋,曹莹(西安电子科技大学计算机学院,陕西西安71OO71)摘要:针对传统单类学习模型对多模态或多密度分布数据描述能力不足的问题,将集成聚类和聚类稳定性分析引入单类学习.首先将确定聚类簇个数与确定聚类簇分布统一到同一个增强单类学习框架中,之后各聚类簇互为正负类分别建起立多个单类分类模型,
2、最后采用最大融合体积方法融合其决策边界.以经典的支持向量数据描述(sVDD)为例,设计了基于集成聚类的稳定支持向量数据描述算法——EcsVDD.在标准UCI数据集和一个真实恶意程序行为数据集上的实验结果表明,ECS-SVDD的性能较单个支持向量数据描述及同类单类学习方法更优.该方法可直接推广到其他最小包含体积集合类型的单类学习算法上,以增强单类学习算法处理多模态和多密度分布数据的能力.关键词:单类学习;离群点分析;聚类分析;聚类稳定性;支持向量数据描述中图分类号:TP181文献标识码:A文章编号:1001-2400(2015)02—0058—07Enhancedone
3、-classlearningbasedonclusteringstabilityanalysisLfUJiachen,MIAOQiguang,SONGJianfeng,CAOYing(SchoolofComputerScienceandTechnology,XidianUniv.,Xi’an710071,China)Abstract:Conventionalone-classlearningmodelsperformpoorlywhendataaremulti—.modalormulti——density.Toaddressthisproblem,ensemblecl
4、usteringandclusteringstabilityanalysisforoneclasslearningareintroduced.Firstly,identifyingthenumberofclustersandtheirdistributionsareunifiedinoneenhancingframework.Thenmultipleone—classlearningmodelsareconstructedtodescribeclustersofthetargetclass.Lastlytheseone-classlearningmodelsarefu
5、sedfollowingthemaximumfusionvolumemethod.Usingclassicsupportvectordatadescription(SVDD)asaninstanceofone—classlearningalgorithm,anensembleclusterbasedstableSVDD,ECS-SVDD,isproposed.ExperimentalresultsonUCIbenchmarkdatasetsandareal—worldmalwaredetectiondatasetshowthattheECS-SVDDoutperfor
6、msthesingleSVDDandsomeotherrelatedone—classlearningalgorithms.Besides,themethodproposedcanalsoenhancetheabilitiesofhandlingmulti.modalandmulti—.densitydataofotherone—-classlearningalgorithmsthatfollowthevolumesetminimizingscheme.KeyWords:one-classlearning;outlieranalysis;clusteranalysis
7、;clusterstability;supportvectordatadescription单类学习[1-z]仅使用正类样本训练机器学习模型,判断新样本属于正类或属于负类.例如在入侵检测问题中,建立分类模型时无法收集尚未出现的入侵行为数据参与训练,因此训练数据中入侵行为类别无法被充分采样,甚至完全无法得到样本.此类问题不适合使用经典二分类机器学习方法解决,而使用单类学习方法以易收集的非入侵行为样本为正类建模,可以更好地完成入侵检测任务.与之类似,图像分割中的非目标收稿日期:2013-1卜2O网络出版时间:2014—07—10基金项目:国家自然科学基金
此文档下载收益归作者所有