半监督模糊fisher降维分析

半监督模糊fisher降维分析

ID:33326402

大小:820.00 KB

页数:11页

时间:2019-02-24

半监督模糊fisher降维分析_第1页
半监督模糊fisher降维分析_第2页
半监督模糊fisher降维分析_第3页
半监督模糊fisher降维分析_第4页
半监督模糊fisher降维分析_第5页
资源描述:

《半监督模糊fisher降维分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、半监督模糊Fisher降维分析收稿日期:基金项目:福建省教育厅资助项目(JA12273,JK2013037,JA13395);泉州市科技局项目(2012Z103)通信作者:李志伟(1965-),男,教授,从事应用数学研究.Wei2785801@qztc.edu.cn.杨昔阳1,邓朝阳2,李志伟1(1泉州师范学院大数据重点实验室泉州福建362000,2泉州医学高等专科学校泉州福建362000)摘要:针对少量具有模糊隶属度类别的数据和大量未知类别的数据组成的数据集,提出了一种结合PCA和局部Fisher判别分析的半监督降维方法。这种半监督方法结合了P

2、CA和局部Fisher判别的优点,一方面可保持所有数据的全局分布结构,另一方面又体现了已知类别属性的样本分类信息。所提出的模型可以通过求解特征值问题求解。实验表明,在获取较为准确的模糊隶属度的情况下,这种算法可以有效地对多维数据进行降维。关键词:模糊隶属度;PCA;局部Fisher判别分析;广义特征值问题ASemi-supervisedFuzzyDimensionReductionMethodYangXiyang1,DengChaoyang2,LiZhiwei1(1KeylaboratoryofIntelligentComputingandInf

3、ormationProcessingofFujianProvince,QuanzhouNormalUniversity,Quanzhou,China,3620002QuanzhouMedicalCollege,Quanzhou,China,362000)Abstract:Thispaperproposedasemi-supervisedfuzzydimensionreductionmethodbycombiningPCAandlocalFisherDiscriminantAnalysis,foradatasetwithasmallnumberof

4、datawithfuzzymembershiplabelsandagreatamountofunlabeleddata.ThismethodtakesadvantagesofPCAandlocalFDAbypreservingtheglobalstructureofunlabeledsamples,andseparatinglabeledsamplesindifferentclassesfromeachother.Ourtestsshowtheusefulnessofthismethodindimensionreduction,providedt

5、hatthefuzzymembershiplabelsarecorrectlygiven.Keywords:FuzzyMembership;PCA;LocalFisherDiscriminantAnalysis;GeneralizedEigenvalueProblem将高维数据转化为低维数据,可以降低模式识别算法的计算量,避免算法陷入“维数灾难”。降维算法通过线性或非线性变换,建立从高维空间到低维空间的映射,并尽量保持数据的邻域分布信息。降维算法可以分为监督降维和无监督降维两种。无监督降维方法包括主成分分析(PrincipleComponentA

6、nalysis,PCA)[1],局部保持投影(LocalityPreservingProjection)[2],多维尺度分析(MultidimensionalScaling)[3]等。这类算法由于缺乏足够的类别指标的指引,对于某些数据集,在降维过程可能会存在一定的盲目性[4]。监督降维方法,包括Fisher判别分析(FisherDiscriminantAnalysis,FDA)[1],局部Fisher判别分析(LocalFisherDiscriminantAnalysis,L-FDA)等[5][6]利用样本的类别属性信息进行降维,在有类别属性的样

7、本(标号样本)足够多的情况下,这类算法往往可以取得较好的降维效果。但是在实际应用场合,获取足够多的标号样本往往是不切实际的。如果仅仅依靠少量标号样本进行降维,当选取的样本没有足够的代表性时,其效果反而不如无监督降维。此时,综合利用大量无标号样本和少量标号样本的半监督降维方法是一种可行的降维手段[4][7]。上述降维方法处理的数据集都是具有分明类别属性的,也就是说一个数据要么属于某一类,要么不属于某一类,没有中间的过渡情况。处理具有模糊隶属度的数据的方法有很多,其中关于降维的算法包括:模糊FDA(FuzzyFisherDiscriminantAna

8、lysis,F-FDA)[8][9],概率型FDA(Probabilisticdiscriminantanalysis)[10]和基于核

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。