一种改进支持向量域数据描述方法及其应用new

一种改进支持向量域数据描述方法及其应用new

ID:34515099

大小:638.64 KB

页数:6页

时间:2019-03-07

一种改进支持向量域数据描述方法及其应用new_第1页
一种改进支持向量域数据描述方法及其应用new_第2页
一种改进支持向量域数据描述方法及其应用new_第3页
一种改进支持向量域数据描述方法及其应用new_第4页
一种改进支持向量域数据描述方法及其应用new_第5页
资源描述:

《一种改进支持向量域数据描述方法及其应用new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第48卷第5期厦门大学学报(自然科学版)Vol.48No.52009年9月JournalofXiamenUniversity(NaturalScience)Sep.2009一种改进支持向量域数据描述方法及其应用罗键,庄进发,李波,吴长庆,黄春庆(厦门大学信息科学与技术学院,福建厦门361005)摘要:针对支持向量域数据描述中的核参数选择及其决策边界规整问题,提出一种新的改进算法.该算法根据支持向量域数据描述本身的特点,利用非高斯性来测量核空间样本接近球形区域分布的程度,并根据此测量结果来优化核参数.当核参数选定之后,核空间样本

2、可能存在分布不均匀的现象,对此,该算法应用核主元分析来进行规整,即通过尺度变换来调整各主轴的长度,以获得一个更合理的球形分界面.最后通过标准数据集和TEP故障诊断仿真以验证该算法,仿真实验结果表明了该算法的有效性.关键词:支持向量域描述;核主元分析;非高斯性中图分类号:TP311文献标识码:A文章编号:043820479(2009)0520656206支持向量域数据描述(Supportvectordatade2ancethenormaldistribution),来产生一个属于N维[1]scription,SVDD)是在支持向

3、量机(Supportvector球形面的随机变量,并在理论上对这3种算法进行了machine,SVM)的基础上提出的一种数据描述算法.比较,得出高斯分布转动不变性法是一种较高效的产它的主要思想是在核特征空间中寻找一个最小超球分生球形面数据集的方法.在文献[5]的基础上,本文提界面,该分界面应尽可能把所有训练样本包围起来,并出一法则,即若多维随机变量中各维服从同均值且同[2]以该分界面对数据进行分类和描述.SVDD的性能方差的独立高斯分布,则该变量的空间分别趋近于球受核参数和最小超球分界面的影响很大,当核参数选形区域.这样就可通

4、过测量核空间样本的非高斯性质择不当,SVDD描述数据的分类效果就不理想;当核参来优化SVDD的核参数值.数选定后,如果样本在核特征空间中分布不够均匀,用当核参数确定之后,如果核空间的样本分布是不球面去包围训练样本就不一定使得SVDD决策边界均匀的,那么应用球形面去包围所有的训练样本,就显线紧凑.针对这两方面的问题,本文提出了一种基于非得不紧凑,如图1所示.在图中,椭圆决策分界面比圆高斯性测量与核主元分析的改进方法.形决策分界面更紧凑地包围样本.针对这个问题,本文献[3]指出选择不同的核函数或设置不同的核文通过核主元分析(Ker

5、nelprincipalcomponentanal2[8]参数,特征样本映射到核空间的维数以及数据集在核ysis,KPCA)来对球形面进行规整,即利用KPCA空间分布形状就有很大的不同.在SVDD算法中,主获得p个主元方向,并计算p个方向上的主轴长度,要通过高斯核函数将特征样本进行映射,并寻找一个然后通过尺度变换使得各主轴的长度相等,从而获取最小超球分界面来尽可能把所有训练样本包围起一个更合理的球形界面.对于KPCA核参数选择,文来[1].本文认为一个理想的SVDD高斯核参数σ,应使献[9]指出在KPCA分析中,最优核参数应该

6、是使核得核空间样本的空间分布形状尽量地趋近于球形区空间特征样本的分布趋于高斯分布,这也与前述求取域[4].这样求解SVDD最优核参数问题就转化为测量核参数的方法一致,因此前述求解得到的核参数可作核空间中样本趋近于超球体的程度.文献[5]介绍了应用蒙特卡罗法(Simplemontecarloalgorithm)、交叉坐标法(Coordinatebycoordinatestrategy)和高斯分[6-7]布转动不变性法(Basedontherotationinvari2收稿日期:2008212230基金项目:国家自然科学基金(60

7、704043),国家“211”工程(王艺之)项目“立体通信和信息集成技术”资助图1用椭圆球面覆盖训练样本Email:jianluo@xmu.edu.cnFig.1Coverthetrainingsampleswithellipsoid第5期罗键等:一种改进支持向量域数据描述方法及其应用·657·为KPCA分析中的核参数.2基于非高斯测度的核参数优化1SVDD简介nd设X={xi}i=1为R空间中的一个样本集,其中n2.1产生球形区域的数据集表示样本的数目.通过一个非线性映射<将样本映射文献[7]指出,如果X1,X2,⋯,Xn为

8、独立且服从到特征空间F中,即<:x∈X

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。