欢迎来到天天文库
浏览记录
ID:9045369
大小:1.39 MB
页数:46页
时间:2018-04-15
《数据的多流形结构分析建模》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、题目数据的多流形结构分析摘要:在海量数据不断产生的时代,对于数据的处理有了更高的要求,而流形学习已经成为信息科学邻域研究的热点。流形学习就是从高维采样的数据中找到高维空间中的低维流形,以实现维数简约或者数据可视化。针对问题一,由于该组数据的子空间相对独立且维数较高,选用基于低秩表示(LRR)的鲁棒性子空间重构算法建立模型,将这组200个数据分成了两类,具体分类结果见表5.1。同时采用传统PCA+K-means算法对数据分类,与LRR分类结果进行比较,LRR分类结果明显优于传统PCA+K-means方法。针对问题
2、二,四个低维空间中的子空间聚类问题和多流形聚类问题,(a)两条交点不在原点且互相垂直的两条直线,采用谱多流形聚类算法(SMMC)建立数学模型将其分为两类,效果见图5.2(a)。(b)为一个平面和两条直线不满足独立子空间的例子,采用稀疏子空间聚类算法模型(SSC)建立数学模型将其分为三类,效果见图5.3。与谱多流形聚类算法(SMMC)建立模型的分类效果相比更好,说明该算法对非独立子空间的分类能力更强。(c)为两条不相交的曲线,采用谱多流形聚类算法(SMMC)将其分为两类,效果见图5.2(c),结果分析说明该算法对
3、噪声的鲁棒性也很好。(d)为两条相交的螺旋线,采用谱多流形聚类算法(SMMC)将其分为两类,效果见图5.2(d)。针对问题三,实际应用中的子空间聚类问题,(a)工业测量中的非接触测量方式所用到的特征提取,需要将十字上的点分成两类,采用一维映射中心方法建立数学模型将其分为两类,效果见图5.6,同时采用谱多流形聚类算法建立数学模型(SMMC)将其分为两类,效果见图5.7,与一维映射中心模型结果比1较,后者分类效果较好,但是鲁棒性差,前者效果稍差,但是适用性强,可处理所有同类型问题。(b)视频中的运动目标分割,在基于
4、低秩表示(LRR)的鲁棒性子空间重构算法基础上,提出基于低秩表示与轨迹方向特征的鲁棒性子空间重构算法(LRRTrack)的改进算法,建立数学模型并求解,将运动目标的特征点轨迹分为了3类,效果见图5.8。与LRR算法比较,改进的算法,对背景点与运动目标点误分类问题处理效果更好,效果见图5.11。(c)根据人脸数据的高维特性,采用了稀疏子空间聚类的方法(SSC)将20张人脸图像数据分为2类,见表5-6,同时采用传统PCA+K-means算法分类,并进行比较,结果与SSC分类结果相同,见表5-7。针对问题四,两个实际
5、应用中的多流形聚类问题,(a)需要将圆台上的点云按照圆台的顶、底、侧面分类,采用谱多流形聚类算法(SMMC)建立数学模型并求解,将其点云分为了三类,效果见图5.13。(b)需要将机器工件外部边缘轮廓按照轮廓线中不同的直线和圆弧组合分类,采用谱多流形聚类算法(SMMC)建立模型将其分为3类,结果见图5.14。关键词:流形学习;LRR;SMMC;SSC;LRRTrack;一维映射模型;PCA;2一、问题的重述1.1问题的背景随着信息爆炸时代的到来,数据集增长的更新更快、数据维度更高、非结构化更突出,而技术的落后造成
6、了信息资源的巨大浪费,所以,迫切需要对这些大数据进行有效的分析,以至数据的分析和处理方法成为了诸多问题成功解决的关键,涌现出了大量的数据分析方法。几何结构分析是进行数据处理的重要基础,已经被广泛应用在人脸识别、手写体数字识别、图像分类、等模式识别和数据分类问题,以及图像分割、运动分割等计算机视觉问题(人脸识别、图像分类、运动分割等实例见下文)中。更一般地,对于高维数据的聚类分析等基本问题,结构分析也格外重要。利用有限高维样本数据进行学习通常会遭遇维数灾难问题,而避免这种问题最常见的方法就是降维。传统的线性子空间
7、方法对非线性结构的数据不能进行有效地处理。高维数据的几何特性使得在低维嵌入流形上建立模型成为可能,予流形方法则是发现高维数据非线性几何结构的有效方法。1.2问题的提出本几何结构分析问题中假设数据分布在多个维数不等的流形上,其特殊情况是数据分布在多个线性子空间上。1.当子空间独立时,子空间聚类问题相对容易。附件一中1.mat中有一组高维数据,它采样于两个独立的子空间。请将该组数据分成两类。2.请处理附件二中四个低维空间中的子空间聚类问题和多流形聚类问题,如图1.1所示。图1.1(a)为两条交点不在原点且互相垂直的
8、两条直线,请将其分为两类;图1.1(b)为一个平面和两条直线,这是一个不满足独立子空间的关系的例子,请将其分为三类。图1.1(c)为两条不相交的二次曲线,请将其分为两类。图1.1(d)为两条相交的螺旋线,请将其分为两类。3.请解决以下三个实际应用中的子空间聚类问题,数据见附件三。(a)受实际条件的制约,在工业测量中往往需要非接触测量的方式,视觉重建是一类重要的非接触测量方法。特征提取是
此文档下载收益归作者所有