基于随机初始化的非线性降维算法的研究

基于随机初始化的非线性降维算法的研究

ID:35182441

大小:3.66 MB

页数:48页

时间:2019-03-21

基于随机初始化的非线性降维算法的研究_第1页
基于随机初始化的非线性降维算法的研究_第2页
基于随机初始化的非线性降维算法的研究_第3页
基于随机初始化的非线性降维算法的研究_第4页
基于随机初始化的非线性降维算法的研究_第5页
资源描述:

《基于随机初始化的非线性降维算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:密级:专业学位研究生学位论文论文题目(中文)基于随机初始化的非线性降维算法的研究Nonlineardimensionalityreductionbased论文题目(外文)onstochasticinitialization研究生姓名田守财学位类别工程硕士专业学位领域计算机技术学位级别硕士校内导师姓名、职称路永钢教授校外导师单位、姓名论文工作起止年月2014年9月至2016年5月论文提交日期2016年5月论文答辩日期2016年5月学位授予日期校址:甘肃省兰州市原创性声明本人郑重声明:本人所呈交的学位论文,是在导师的指导下独立进行研究所取得的成果。学

2、位论文中凡引用他人已经发表或未发表的成果、数据、观点等,均已明确注明出处。除文中已经注明引用的内容外,不包含任何其他个人或集体已经发表或撰写过的科研成果。对本文的研究成果做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律责任由本人承担。论文作者签名:日期:关于学位论文使用授权的声明本人在导师指导下所完成的论文及相关的职务作品,知识产权归属兰州大学。本人完全了解兰州大学有关保存、使用学位论文的规定,同意学校保存或向国家有关部门或机构送交论文的纸质版和电子版,允许论文被查阅和借阅;本人授权兰州大学可以将本学位论文的全部或部分内容编入有关数据库进

3、行检索,可以采用任何复制手段保存和汇编本学位论文。本人离校后发表、使用学位论文或与该论文直接相关的学术论文或成果时,第一署名单位仍然为兰州大学。本学位论文研究内容:□可以公开□不宜公开,已在学位办公室办理保密申请,解密后适用本授权书。(请在以上选项内选择其中一项打“√”)论文作者签名:导师签名:日期:日期:基于随机初始化的非线性降维算法的研究中文摘要进入21世纪以来,随着互联网和信息行业的发展,人们获得的数据量正在以几何级的速度快速增长。在许多领域,如电子商务、天文、航空航天等,每天所收集的数据已经不能用传统的GB或TB来衡量。目前,数据正在从不同层面对

4、人类社会经济生活产生着重要而深远的影响。如此海量的数据即给人们的生活带来了方便,也给一些企业和科研工作人员带来了烦恼。丰富的信息可以让人们在做出选择前有更多的权衡。但是如何从海量数据中快速的挖掘出对企业有意义的数据已经成为企业需要面对的问题。如何对这些体积庞大、维度更高的数据进行有效的分析也在困扰着科研工作人员。其实,解决这些问题的根本就在于如何通过一种技术手段将这些维度很高的数据用我们熟悉的低维数据来表示。因为一旦数据的维度变的很低,对我们来说,处理起来就非常的简单。降维技术的存在正好可以被用来解决这一类问题。降维技术的出现给企业和科研工作人员的工作提

5、供了极大的便利。通过使用降维技术,我们可以更容易地对高维数据的低维表示进行分析。如此一来,我们就可以去更好的应用这些高维数据。降维技术的产生经历了一个由线性到非线性的过程。在早期,线性降维技术应用的比较广泛。诞生了许多线性降维算法。例如有主成分分析算法、线性判别算法、投影寻踪算法等。对于一些其结构呈现线性关系的数据,线性降维算法往往能得到较好的降维结果。但是,随着数据体积以及维度的不断增加,数据的结构也发生了很大变化。数据之间的结构不再是简单的线性关系,而是一种更加复杂的非线性结构。在对具有非线性结构的数据上应用线性降维算法时,其得到的低维结果往往无法令

6、人满意。为了解决这一难题,许多非线性降维算法近年来相继被人们提出。比如有多维尺度分析算法、ISOMAP算法、局部线性嵌入降维算法、随机邻域嵌入算法以及t分布随机邻域嵌入算法等等。与线性降维算法相比,非线性降维算法在面对结构为非线性的数据时往往具有着明显的优势。其得到的低维结果也往往好于由线性降维算法产生的低维结果。本文主要讨论的是非线性降维算法。在对几种线性降维算法的原理进行简单介绍之后,接着对部分非线性降维算法的原理及具体的实现过程进行了详细的介绍。通过对不同的非线性降维算法原理的比较。在此基础上本文提出了一种新的I基于随机初始化的非线性降维算法,称之

7、为最近邻随机嵌入(Stochasticnonlineardimensionalityreductionbasedonnearestneighbors,简称NNSE)算法。我们将该算法产生的低维结果与另外三种降维算法(主成分分析算法、局部线性嵌入算法、t分布随机邻域嵌入算法)得到的低维结果首先进行了可视化这一非量化指标的比较。对于那些通过可视化结果难以区分孰优孰劣的降维算法,我们又对其进行了一种量化指标的比较。截止至目前,在评价不同的降维算法结果好坏方面还没有统一的量化指标;但是我们知道,对于一个好的降维算法来说,如果高维数据中的任意两个样本点在高维空间下

8、是邻近点,降维之后这种邻近关系应该能够在低维空间中保持。基于以上原则,我们提出了

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。