资源描述:
《一种基于局部保持的隐变量模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一种基于局部保持的隐变量模型第23卷第3期2010年6月模式识别与人工智能PR&AIVo1.23JunNo.32010一种基于局部保持的隐变量模型木王秀美高新波张乾坤宋国乡(西安电子科技大学理学院西安710071)(西安电子科技大学电子工程学院西安710071)摘要隐变量模型是一类有效的降维方法,但是由非线性核映射建立的隐变量模型不能保持数据空间的局部结构.为了克服这个缺点,文中提出一种保持数据局部结构的隐变量模型.该算法充分利用局部保持映射的保局性质,将局部保持映射的目标函数作为低维空间中数据的先验信
2、息,对高斯过程隐变量中的低维数据进行约束,建立局部保持的隐变量.实验结果表明,相比原有的高斯过程隐变量,文中算法较好地保持数据局部结构的效果.关键词降维,隐变量模型(LVM),局部距离保持中图法分类号TP391ALatentVariableModelBasedonLocalPreservationWANGXiu.Mei,,GAOXin.Bo.,ZHANGQian—Kun,SONGGuo.Xiang(SchoolofSciences,XidianUniversity,Xi'an710071)(SchoolofEl
3、ectronicEngineering,XidianUniversity,凡710071)ABSTRACTLatentvariablemodel(LVM)isakindofefficientnonlineardimensionalityreductionalgorithmthroughestablishingsmoothkernelmappingsfromthelatentspacetothedataspace.However,thiskindofmappingscannotkeepthepointsclose
4、inthelatentspaceeventheyarecloseindataspace.ALVMisproposedbasedonlocalitypreservingprojection(LPP)whichcanpreservethelocalitystructureofdataset.TheobjectivefunctionofLPPisconsideredasapriorofthevariablesintheGaussianprocesslatentvariablemodel(GP—LVM).Theprop
5、osedlocalitypreservingGP—LVMisbuiltwiththeconstrainedtermoftheobjectivefunction.ComparedwiththetraditionalLPPandGP—LVM.experimentalresultsshowthattheproposedmethodperformsbetterinpreservinglocalstructureoncommondatasets.KeyWordsDimensionalityReduction,Latent
6、VariableModel(LVM),I~calDistancePreservation国家自然科学基金项目(No.60702061,6077106,60702061),教育部长江学者和创新团队支持计划项目(No.IRT0645)资助收稿日期:2009—04—27;修回日期:2009—10—09作者简介王秀美,女,1978年生,博士研究生,主要研究方向为机器学习,统计模型.E-mail:wangxiumei@gmail.corn.高新波,男,1972年生,教授,博士生导师,主要研究方向为视频信息处理与分析,模式
7、识别和机器学习.张乾坤,男,1984年生,硕士研究生,主要研究方向为统计学习,子空间分析.宋国乡,女,1938年生,教授,博士生导师,主要研究方向为小波分析,数值计算.370模式识别与人工智能23卷1引言在模式识别和机器学习领域,人们常常要处理大量的高维数据.这些数据维数过高,使得在数据处理中计算量很大,不能对数据进行有效分析,这就是机器学习中的"维数灾难"问题.因此,寻求较好的降维方法,以正确获得高维数据集的潜在低维结构信息是当前大家普遍关注的问题.主成分分析(PCA)是最为经典也是应用最为广泛的降维方法.P
8、CA的主要思想是用较少的综合变量来代替原来较多的变量,同时要求这几个综合变量互相不相关,并能尽可能多地表示原来数据的能量,它是将多指标化为少数几个综合指标的一种统计分析方法.由PCA衍生并推广出了的概率主成分分析(ProbabilisticPCA,PPCA)和核主成分分析(Ker—nelPCA,KPCA)两种降维方法,其中,PPCA是对PCA的概率推广,仍然是通过线性变换达到降维的目的