欢迎来到天天文库
浏览记录
ID:34020210
大小:9.39 MB
页数:89页
时间:2019-03-03
《低维低秩数据表达与嵌入》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、万方数据独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得安徽大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:泺藿、I签字日期:加J毕年f7月羽日学位论文版权使用授权书本学位论文作者完全了解安徽大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借
2、阅。本人授权安徽大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:导师签名:l百琵『)匕签字日期:≯J够年If月zD日签字日期:羽f够年//月刃Et万方数据低维低秩数据表达与嵌入摘要面对当前日益增长的大量数据,越来越多的机器学习算法将从大量数据中获得问题求解所需要用到的有效信息。作为大规模智能化数据分析与处理的重要方法,低维低秩技术不仅有效降低了数据处理过程中的计算复杂度,同时也显著提高了大规模数据分析的准确率。
3、低维低秩技术广泛应用于模式识别和机器学习领域。已经成为解决各行各业相关诸多问题的关键技术。尽管关于低维低秩的研究已经取得了丰富的成果,但由于当前应用中数据的高维度含噪声特点,应用工作又面对了新的挑战。在机器视觉、生物数据分析、金融数据分析、文本及图像检索等应用工作的推动下,低维低袄技术通过对现存方法迸行完善并开始探索新的研究方法。本文在研究大规模数据的基础上,深入研究了关于向量数据和高维数据的低维低秩技术及其在各类领域中的应用问题。作为低维低秩研究的这些新成果,本文在多个研究方面进行了相关工作,取得的模型及其求解算法在人脸识别、
4、手写体字符识别、生物数据分析等领域得到了很好的应用。本文中,我们将研究在含有噪声的数据上进行维度约减和子空间提取工作的相关模型及其算法。首先分析了基于trace-norm的经典算法,然后研究可以进行直接低秩工作的正则化方法,这种方法可以直接应用于数据聚类工作。针对我们需要解决的低秩数据聚类问题,本文在f1范式约束上分别加上正交约束以及非负约束。这两种模型可以同时保持住直接对数据进行低秩的能力。数据嵌入的维度意义非常清晰明了。本文同时还研究了有效的算法来求解这两种基于f1范式的优化问题。我们将这两个模型应用于人脸数据集、手写体字符
5、集以及基因表达数据集上。进行了丰富的实验工作。实验结果表明,本文中的低秩去噪模型对于聚类以及半监督分类工作有着非常好的效果。现存的很多机器学习应用工作中,会处理大量各种含有噪声的数据。本文中,我们研究一种鲁棒的低秩表示模型,此模型可以处理现实中的含噪声数据。我们同时也研究求解该模型的优化方法,保证模型可以收敛到全局最优解。与目前已知的低秩表示方法不同,我们研究的模型期望计算向量组合的最稀疏表示,其中的数据有部分已经被破坏;同时,我们将模型的秩降到整个数据集的类别数。不论从理论角度或是实验角度看,这种低秩表示模型都是一个有力的数据
6、预处理方法。万方数据低维低秩数据表达与嵌入在基于前述稀疏学习的基础上,本文研究将变量相关度加入基于稀疏学习的变量选择模型中。可以看到,在以往的类LASSO变量选择工作中没有考虑变量相关度。而在大部分现实应用的数据中,预测因子常常是相关的。强相关的预测因子会有相似的属性,并含有一些重复信息。尤其当被选出因子的数量较为有限时,我们需要这些被选出的因子含有较多的信息,所以希望模型尽量不要选出相关度较高的预测因子。强相关的预测因子最好只被挑出一个,它将会含有大量的信息。以我们了解的目前文献看,现存的类LASSO变量选择方法没有考虑变量相
7、关度。我们研究“不相关LASSO变量选择”模型;接着对这个模型进行理论分析,研究解决它的有效迭代算法并证明了其收敛性。我们在两个著名的基因数据集上验证了模型的有效性。目前,许多数据应用工作带来越来越多的高维及含有噪声的数据。在本文中,我们仍然考虑维度约减工作,同时考虑去噪相关工作。本文中,我们研究将局部线性映射(LLE)模型中的两个步骤(计算近邻点和计算权值)进行结合,整合成为一套独立而完整的体系。我们将这种方法称为鲁棒的集成局部线性嵌入模型。模型通过基于12.1—12混合范式的优化问题进行去噪工作。本文同时也研究了一种有效的算
8、法来求篇这个模型,在各类数据集上进行了丰富的实验来证明模型的有效性。实验发现,我们研究的集成局部线性嵌入模型在去噪、嵌入和聚类工作中有着很好的效果。关键字:低维低秩,数据表达,数据嵌入万方数据LowDimension/RankDataRepresentation
此文档下载收益归作者所有