欢迎来到天天文库
浏览记录
ID:28068167
大小:18.22 KB
页数:5页
时间:2018-12-08
《基于改进smmc模型的多流形结构数据分析》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。基于改进SMMC模型的多流形结构数据分析 摘要:提出一种改进的多流形谱聚类模型,提高复杂流形结构中的聚类精度。改进模型的核心在于首先对原始数据进行空间映射,得到能体现原始数据流形结构的数据;其次,根据流形距离的定义,利用局部点邻域构造各点的切平面,将切平面参数作为新流形的数据样本;最后用SMMC模型求解,得到聚类结果。实验结果表明,改进的SMMC模型对
2、独立子空间、非线性良分离以及非线性交叉流形这三类数据的子空间聚类效果良好,且具有强鲁棒性和通用性。 关键词:SMMC模型;流形学习;子空间聚类;多流形建模 DOIDOI:/ 中图分类号:TP303 文献标识码:A文章编号:1672--0029-04 0引言为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师培训同步进
3、行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 随着大数据时代的到来,数据量呈爆发式增长。如何对数据进行有效分析和处理已成为成功解决诸多问题的关键,由此涌现出大量的数据分析方法。在实际问题分析中可发现,大部分数据集实质上是由许多集合结构组合而成的。几何结构分析现已被广泛应用于对象识别、图像分类等模式识别和分类问题,同时也是对高维数据进行相关性分析、聚类分析等的有效方法。其中流形学习是几何结构分析方法中的重要组成部分[1-2]。流形学习的目的在于把高维数据在低维流形中表示出来,从
4、而便于数据分析与存储,近年来流形学习的研究特别是多流形的研究逐渐增多[3]。 子空间聚类、混合线性模型、流形聚类等是目前主流的多流形模型方法。尽管目前对流形学习的研究较多,但仍面临巨大的挑战[4-5]。基于谱聚类的多流形聚类方法是众多流形聚类方法中的一类,它克服了传统稀疏子空间聚类算法不能很好地解决非线性子空间聚类的缺陷,能将线性或非线性、良分离或交叠的流形等多流形问题进行聚类,具有强大功能[1]。 本文在深入分析多流形谱聚类模型的基础上提出一种改进方法,对独立线性子空间、良分离曲线以及交叠曲线流形聚类中的3种典型数据进行聚
5、类,并与其它流形聚类方法进行比较,实验结果表明,改进模型具有更好的聚类效果。 1理论基础 多流形谱聚类模型 SMMC模型的基本思想是�南嗨菩跃卣蟮慕嵌瘸龇�,充分利用流形采样点所包含的自然的局部几何结构信息,辅助构造更适合的相似性矩阵,进而发现正确的流形聚类[5-6]。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安全教育、健康教育、反邪教教育等丰富学生的课余文化生活。为了确保“教学点数字教育资源全覆盖”项目设备正常使用,我校做到安装、教师
6、培训同步进行。设备安装到位后,中心校组织各学点管理人员统一到县教师进修学校进行培训,熟悉系统的使用和维护。 根据数据点内包含的局部几何结构信息辅助构造相似性矩阵W[5]。当两个数据点满足条件相互靠近同时具有相似的局部切空间时,才能断定它们是来自同一个流形聚类。因此结合数据点之间的欧氏距离关系qij=q和局部切空间之间的相似性pij来决定最后的相似性权值: 其中,f表示融合函数。结合理论与实际可知,两点划分为同类的概率与结构相似性成正比,与两者之间的欧式距离成反比。为使相似矩阵具有预期性质,融合函数f关于pij单调递增,关于q
7、ij单调递减。 假设数据点xi和xj处的局部切空间为Θi和Θj,则两数据点的局部切空间之间结构相似性可定义为: 流形距离 对于流形分类问题,其距离测度需要满足条件:在相同流形上的点的距离大于在不同流形上点的距离,而欧式距离不能体现该性质。为了满足聚类全局一致性的目的,使同一流形结构中的数据点的相似度高,而不同流形结构中的数据点的相似度低,使用一种能够体现全局一致性的测度―流形距离核测度。 所有样本点看作是图G=的顶点,其中p∈Vl表示图上一个长度为l=p-1的连接点p1与pp的路径,边E,1≤k8、xi和xj的所有路径集合;dsp是图G上节点xi和xj之间的最短路径距离。d是图上节点xi到xj最短路径上任意相邻两点的欧式距离。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安
8、xi和xj的所有路径集合;dsp是图G上节点xi和xj之间的最短路径距离。d是图上节点xi到xj最短路径上任意相邻两点的欧式距离。为了充分发挥“教学点数字教育资源全覆盖”项目设备的作用,我们不仅把资源运用于课堂教学,还利用系统的特色栏目开展课外活动,对学生进行安
此文档下载收益归作者所有