欢迎来到天天文库
浏览记录
ID:19144286
大小:6.13 MB
页数:55页
时间:2018-09-20
《数据的多流形结构分析7》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、参赛密码(由组委会填写)第十二届“中关村青联杯”全国研究生数学建模竞赛学校重庆理工大学参赛队号116600171.冉小华队员姓名2.胡猛3.陈华良参赛密码(由组委会填写)第十二届“中关村青联杯”全国研究生数学建模竞赛题目数据的多流形结构分析摘要:针对多流形结构的聚类问题,本文提出稀疏子空间聚类模型以及改进优化算法对常规的多流形结构数据进行聚类,并用谱多流形聚类模型(SMMC)对混合流形结构数据进行聚类。问题一:需将200个高维数据分为两类,本文首先建立稀疏子空间聚类模型,在此运用交替方向法求出解稀疏系数,然后利用高维数据的稀疏表示系数构造相似度矩阵,最后利用谱聚类方法,得到数据的聚类结果:1
2、-40和141-200之间的样本点划分到一类,41-140之间的样本点为另一类。问题二:针对子问题(a)两条交点不在原点且相互垂直的两条直线进行分类,我们应用稀疏子空间聚类模型并得到较好的分类结果;(b)一个平面和两条直线分成三类和(c)两条不相交的二次曲线分成两类情形,本文建立拉普拉斯特征映射模型,利用拉普拉斯嵌入描述数据的局部几何结构关系进行聚类,最终的分类结果都比较理想;(d)两条相交的螺旋线分成两类,本文采用谱多流形聚类方法进行分类。首先从整个数据中分离出不同的连通或可分离子集,然后进一步将相交的子集分割为相交区域和非相交区域,最后用谱多流形聚类方法得聚类结果比较准确。问题三:针对子
3、问题(a)对十字上的点位置信息进行分类,本文运用谱多流形聚类方法进行聚类,得出具有较好地分类效果;(b)对已提取特征点后的轨迹进行运动分割。在此对稀疏子空间聚类模型中的交替方向法进行改进。调整交替方向法的惩罚参数,将稀疏子空间聚类应用到视频运动分割中,从而得到特征点轨迹的分类结果:1-138之间的特征点划为第2类,139-214之间的特征点划为第3类,215-297之间的特征点划为第1类;(c)将在不同光照下的人脸图形分成两类,本文同样稀疏子空间聚类模型中的交替方向法进行改进,研究线性化的自适应线性交替方向法。同时把稀疏子空间聚类应用到人脸分类中进行分析,得出分类结果:1-5幅图和11-15
4、幅图都被划分到第1类,而6-10幅图和16-20幅图。被划分到第2类,聚类准确率100%。问题四:针对子问题(a)对圆台的点分成三类,由于在运用原始数据分类过程中发现内存溢出,所以本文首先对原始数据采样,然后对采样点进行谱多流形聚类,最后运用邻近分类算法对剩下的数据进行分类,得到理想的分类结果;(b)问题,由于机器工件外部边缘轮廓图较为复杂,而且噪音点较多,本文建立谱多流形聚类模型进行分类,最后分别将其划分为二、三、四、五类,实验结果表面可以有效地将轮廓线中不同的直线和圆弧区分开。关键词:稀疏子空间聚类;交替方向法;拉普拉斯特征映射;谱多流形聚类一、问题重述我们已经进入了一个信息爆炸的时代,
5、海量的数据不断产生,迫切需要对这些大数据进行有效的分析,以至数据的分析和处理方法成为了诸多问题成功解决的关键,涌现出了大量的数据分析方法。几何结构分析是进行数据处理的重要基础,已经被广泛应用在人脸识别、手写体数字识别、图像分类、等模式识别和数据分类问题,以及图象分割、运动分割等计算机视觉问题(人脸识别、图像分类、运动分割等实例见下文)中。更一般地,对于高维数据的相关性分析、聚类分析等基本问题,结构分析也格外重要。大量的数据降维方法被用来挖掘数据集的低维线性子空间结构,这类方法假设数据集采样于一个线性的欧氏空间。针对单一子空间结构假设的后续讨论主要是两个方面,首先是从线性到非线性的扩展,主要的
6、代表性工作包括流形(流形是局部具有欧氏空间性质的空间,欧氏空间就是流形最简单的实例)学习等。其次是流形或子空间从一个到多个的扩展,即假设数据集采样于多个欧氏空间的混合。子空间聚类(是将数据按某种方式分类到其所属的子空间的过程。通过子空间聚类,可以将来自同一子空间中的数据归为一类,由同类数据又可以提取对应子空间的相关性质。本几何结构分析问题中假设数据分布在多个维数不等的流形上,其特殊情况是数据分布在多个线性子空间上。请按照文献中的方法或以文献中的方法为基础创新新的方法完成以下问题:1.当子空间独立时,子空间聚类问题相对容易。附件一中1.mat中有一组高维数据,它采样于两个独立的子空间。请将该组
7、数据分成两类。2.处理附件二中四个低维空间中的子空间聚类问题和多流形聚类问题:(1)将两条交点不在原点且互相垂直的两条直线,请将其分为两类;(2)对不满足独立子空间的关系时,将一个平面和两条直线,请将其分为三类;(3)将两条不相交的二次曲线划分为两类。(4)将两条相交的螺旋线划分为两类。3.解决以下三个实际应用中的子空间聚类问题。(a)受实际条件的制约,在工业测量中往往需要非接触测量的方式,视觉重建是一类重要
此文档下载收益归作者所有