矩阵分解在数据挖掘中的应用

矩阵分解在数据挖掘中的应用

ID:34069958

大小:4.10 MB

页数:82页

时间:2019-03-03

矩阵分解在数据挖掘中的应用_第1页
矩阵分解在数据挖掘中的应用_第2页
矩阵分解在数据挖掘中的应用_第3页
矩阵分解在数据挖掘中的应用_第4页
矩阵分解在数据挖掘中的应用_第5页
资源描述:

《矩阵分解在数据挖掘中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据矩阵分解在数据挖掘中的应用⑧论文作者签名:指导教师签名:论文评阅人l:黄庆明教授中国科学院大学评阅人2:评阅人3:评阅人4:评阅人5:答辩委员会主席:委员1:委员2:委员3:委员4:委员5:吴飞教授浙江大学答辩日期:2014年6月9曰万方数据MatrixFactorizationintheApplicationofDataMiningAuthor’ssignSupervisor’ssignExternalReviewers:QingmingHuangProfessorUCASExaminingCommiExaminingCommiAnonymousZhon

2、gfeiZhangProfessorZJUDateoforaldefence:June9th.2014万方数据浙江大学研究生学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:杏挚JR签字日期:2al7c年石月f7日学位论文版权使用授权书本学位论文作者完全了解浙江大学的复印件和磁盘,允许

3、论文被查阅和借阅。有权保留并向国家有关部门或机构送交本论文本人授权浙江大学可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书)学位论文作者签名:套炎曰B签字日期:沙lf年占月/7日篡磊蟛A签字日馘:≯o≯千年6其f7万方数据致谢首先感谢我的导师张仲非教授3年多来对我的指导和帮助。在我的博士生期间,张老师一直非常关心我的学习和生活,在诸多方面为我排忧解难,帮助我解决在生活中遇到的各种问题,针对我研究过程中遇到的难题和瓶颈,张老师从来都是耐心的解答,和我一起研究分析,提

4、出很多创造性的观点,他对工作一丝不苟的作风给了我深刻的影响,将使我受益终身。在此,我再次向张老师表示衷心的感谢,祝张老师身体健康,工作顺利,万事如意!感谢我的合作者杨名和祁仲昂同学,你们的帮助对我进行的科学研究起到了极大推动作用。感谢李玺老师在毕业前几个月里从生活和工作方面给予的悉心指导。感谢实验室的楼老师和其他同学们,赵学义,金永波,赵品,王跃,何周舟,方正.虞盛康、皮特,张亚庆,黄思羽,刘喜昂,感谢你们在科研和生活中的帮助和相伴,祝愿你们能在以后的工作和科研中取得成功。最后还要感谢我的家人,是你们陪我走过了人生中的将近三十个春秋岁月,一直无私的支持着我的求学道

5、路,使我坚持到现在完成了我的博士学业。此外,本论文的完成得到了国家科技部973项目(2012CB316400),浙江大学一阿里巴巴金融联合实验室.浙江省网络媒体云处理和分析工程研究中心.和浙江大学先进媒体信息处理与智能系统创新团队的资助。万方数据摘要矩阵分解在很多需要数据挖掘技术的实际应用中非常热门,例如信息检索,机器视觉和模式识别等领域。矩阵分解旨在使用两个或者更多的低维矩阵来逼近一个高维矩阵。在现实应用中,数据通常会有各种各样的特点:数据可能会有全局几何结构;数据也可能是非常稀疏的;训练数据集可能是非常有限的。这就需要人们围绕数据的特点设计不同的矩阵分解方法。

6、本文研究了矩阵分解在实际应用中的一些突出问题。基于现有的工作,我们借用不同的数据结构提出了不同的矩阵分解方法,用来解决实际问题。本文的主要工作和贡献在下面几个方面:1.针对数据表示中存在的问题,提出了一种坐标排序正则化非负矩阵分解方法,以更好的利用数据的全局流形几何结构。这个方法的主要思想是结合非负矩阵分解和流形排序方法来同时利用数据的局部和全局几何结构。在真实数据上的实验结果说明了所提出算法的优越性。2.针对科学文章推荐存在的问题,提出了一种主题回归矩阵分解模型。这种分解模型主要是使用概率主题建模对矩阵分解进行拓展。主题回归矩阵分解模型通过引入一个回归模型对用户

7、隐藏变量进行正则化,这种正则化是基于一个假设:评价过相似项目的用户有着相似的偏好。进一步,主题回归矩阵分解模型可以为用户和项目提供可解释的隐藏变量:并且可以为社区用户作出准确的预测。此外,我们在CiteULike网站提供的一个较大的真实数据集上验证了算法的效率。实验结果表明本算法在性能上要优于现有的代表性算法。3.针对科学文章中存在相关性结构的问题,我们提出了主题回归多矩阵分解模型。这种分解模型可以将主题回归模型和相关性矩阵分解结合起来。此外,我们还提出了带有相关性矩阵分解的协同主题回归模型,此模型可以作为主题回归多矩阵分解模型的基准比较算法。同样.我们在Cite

8、ULike

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。