使用聚类稳定性分析方法增强单类学习算法-论文.pdf

使用聚类稳定性分析方法增强单类学习算法-论文.pdf

ID:57925109

大小:829.46 KB

页数:8页

时间:2020-04-14

使用聚类稳定性分析方法增强单类学习算法-论文.pdf_第1页
使用聚类稳定性分析方法增强单类学习算法-论文.pdf_第2页
使用聚类稳定性分析方法增强单类学习算法-论文.pdf_第3页
使用聚类稳定性分析方法增强单类学习算法-论文.pdf_第4页
使用聚类稳定性分析方法增强单类学习算法-论文.pdf_第5页
资源描述:

《使用聚类稳定性分析方法增强单类学习算法-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2015年4月西安电子科技大学学报(自然科学版)Apr.2015第42卷第2期J0URNAL0FXIDIANUNIVERSITYVo1.42NO.2doi:10.3969/j.issn.1001—2400.2015.02.010使用聚类稳定性分析方法增强单类学习算法刘家辰,苗启广,宋建锋,曹莹(西安电子科技大学计算机学院,陕西西安71OO71)摘要:针对传统单类学习模型对多模态或多密度分布数据描述能力不足的问题,将集成聚类和聚类稳定性分析引入单类学习.首先将确定聚类簇个数与确定聚类簇分布统一到同一个增强单类学习框架中,之后各聚类簇互为正负类分别建起立多个单类分类模型,

2、最后采用最大融合体积方法融合其决策边界.以经典的支持向量数据描述(sVDD)为例,设计了基于集成聚类的稳定支持向量数据描述算法——EcsVDD.在标准UCI数据集和一个真实恶意程序行为数据集上的实验结果表明,ECS-SVDD的性能较单个支持向量数据描述及同类单类学习方法更优.该方法可直接推广到其他最小包含体积集合类型的单类学习算法上,以增强单类学习算法处理多模态和多密度分布数据的能力.关键词:单类学习;离群点分析;聚类分析;聚类稳定性;支持向量数据描述中图分类号:TP181文献标识码:A文章编号:1001-2400(2015)02—0058—07Enhancedone

3、-classlearningbasedonclusteringstabilityanalysisLfUJiachen,MIAOQiguang,SONGJianfeng,CAOYing(SchoolofComputerScienceandTechnology,XidianUniv.,Xi’an710071,China)Abstract:Conventionalone-classlearningmodelsperformpoorlywhendataaremulti—.modalormulti——density.Toaddressthisproblem,ensemblecl

4、usteringandclusteringstabilityanalysisforoneclasslearningareintroduced.Firstly,identifyingthenumberofclustersandtheirdistributionsareunifiedinoneenhancingframework.Thenmultipleone—classlearningmodelsareconstructedtodescribeclustersofthetargetclass.Lastlytheseone-classlearningmodelsarefu

5、sedfollowingthemaximumfusionvolumemethod.Usingclassicsupportvectordatadescription(SVDD)asaninstanceofone—classlearningalgorithm,anensembleclusterbasedstableSVDD,ECS-SVDD,isproposed.ExperimentalresultsonUCIbenchmarkdatasetsandareal—worldmalwaredetectiondatasetshowthattheECS-SVDDoutperfor

6、msthesingleSVDDandsomeotherrelatedone—classlearningalgorithms.Besides,themethodproposedcanalsoenhancetheabilitiesofhandlingmulti.modalandmulti—.densitydataofotherone—-classlearningalgorithmsthatfollowthevolumesetminimizingscheme.KeyWords:one-classlearning;outlieranalysis;clusteranalysis

7、;clusterstability;supportvectordatadescription单类学习[1-z]仅使用正类样本训练机器学习模型,判断新样本属于正类或属于负类.例如在入侵检测问题中,建立分类模型时无法收集尚未出现的入侵行为数据参与训练,因此训练数据中入侵行为类别无法被充分采样,甚至完全无法得到样本.此类问题不适合使用经典二分类机器学习方法解决,而使用单类学习方法以易收集的非入侵行为样本为正类建模,可以更好地完成入侵检测任务.与之类似,图像分割中的非目标收稿日期:2013-1卜2O网络出版时间:2014—07—10基金项目:国家自然科学基金

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。