欢迎来到天天文库
浏览记录
ID:35057014
大小:6.27 MB
页数:74页
时间:2019-03-17
《基于hadoop的聚类协同过滤推荐算法研究及应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、学巧代号10532学号S1309W4020TP391密级公开分类号碱或乂掌HUNANUNIVERSITY工程硕±学位论文基于Hadoop的聚类协同过滤推荐算法研究及应用学位由请人姓名徐江辉工巧学院培养单位电气与信息1导师姓名及职約谭建豪教授刘国清离级:程师学科专业控制工程研究方向数据挖掘2016年05月06H论文提交日期学校代号:10532学号:S1209W409密级:公开湖南大学工程硕±学位论文基于Hadoop的聚类协同过
2、滤推荐算法研究及应用学位串请人姓名=徐江辉导师姓名及巧祿;巧建安巧授刘国清高级工招师培养m位;电气与信息工程学院专业名称;控制工程论文涅交日期:2016年05月06日论义答锐日期;2016年05月20日答縣委员会主巧=孙巧教授民esearchandAlicationofClusterinCollaborativeFil1:erinppgg民ecommendationAlgorithmBasedonHadoopByXuJianghuiB.S
3、.(ChangshaUniversity)2013Athesissubmittedinartialsatisfactio打ofthepReuirementsforthedereeofqgMasterofEngineeringinGo打化olEnineeringgin化eGraduateSchoolofHunanUniversitySupervisorProfessorTanJianhao,SeniorEngi打eerLiuGuoqingAr
4、il2016p,湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研巧所取得的ji研究成果。除了文中特别加y标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均己在文中レッ明确方式标明。本人完全意识到本声明的法律后果由本人承担。■作者签名:冶曰期:^八年月曰学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保。留并向国家有关部口或机构送交论文的复印件和电子版,允许论文
5、被查阅和借阅本人授权湖南大学可W将本学位论文的全部或部分内容编入有关数据库进斤检、。索,可采用影印缩印或扫描等复制手段保存和汇编本学位论文本学位论文属于1、保密□,在解密后适用本授权书。年2、不保密囚。""(请在W上相应方框内打V)作者签名:体山日期:A年月日导师签名曰期:。八年y月2^曰I基于Hadoo的聚类协同过滤推荐算法研究及应用p摘要随着互联网的快速发展,网络数据量不断增加,已经进入了大数据时代。大一-量的信息和商品同时呈现在用户面前,使我们面临个严重的问题信息过载,而一
6、个性化推荐是解决该问题个有效的方法,协同过滤方法是目前在实际推荐系统中应用最多的个性化推荐方法,它基于群体的偏好来为用户提供推荐。传统单机的协同过滤算法无论从效率上,还是从计算复杂度上都已无法满足海量信息的处理需要,云计算技术的发展为推荐算法提供了新的研究方向。因此,可W考虑利用结合大数据技术来应对算法扩展性等问题。本文对基于Hadoop大数据处理技术的聚类协同过滤推荐算法进行研究与实adoo现,并对电影数据集进行应用分析。主要对Hp两大主要框架、经典聚类算法及推荐算法的相关概念进行了研究;提出基于Hadoo
7、p大数据处理技术的分布式聚类协同过滤推荐算法,来解决协同过滤算法应对数据稀疏性和算法的扩展性问题;对数据的稀疏性采用矩阵分解方法预处理初始数据,将预处理后的数据通过聚类算法来建立聚类模型,然后利用聚类模型和协同过滤算法形成推荐的候选空间,最后完成推荐。本文的工作重点总结;(1)对于常用的聚类算法做了研究分析,全面了解各类典型算法的优缺点,-means聚重点研巧了K类算法。(2)对经典的推荐算法做了深入的研究分析,着重分析了协同过滤推荐算法。(3)针对数据的稀疏性采用矩阵分解算法预处理,改善数据稀疏性
8、后利用改进的K-means聚类算法构建聚类模型。4-m()结合Keans聚类模型与协同过巧推荐算法做混合推荐。-mean(5)对Ks聚类算法、协同过滤推荐貧法进行改进,使其能够适应MapRe
此文档下载收益归作者所有