欢迎来到天天文库
浏览记录
ID:35049678
大小:3.37 MB
页数:59页
时间:2019-03-17
《协同过滤推荐算法研究及mapreduce实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、-■-.,I.;--分类号sTP311:10636单位代码^:么03300巧续开学号:211114一、巧心坤锭乂麥硕±学位论文一一,哦-<-'獲)>疋中文论文题目:棘同过滤推著义法济究及*M-ap汉educe实现著英文论文趣目:Resear地onCoUaborative巧1化ring■'--,u?RecommendedAorithmand忠lg.?■i..ImoienentationofMapReduce^■--..L'.-.-".r,
2、,—,^中论文作者!綱'?'■指导教师r郭涛;.^-4r,.专业名称Vr计算化拉用技术;,研究方向^一I数据按掘1所在学院,计算化科举举院1论文提交日期-:2016年4月1曰矿-.-论文眷辩曰期壽;2016年5月29日兵.I/’一於’—"—.-广*兮''7尸.一四川师范大学学位论文独创性声明‘本人声明:祈單々学仿讼丈化、圆甘取始暮嗟^薪雖是人巧导师苗指导下。除文中已经注明引本济,独立进行研究工作所取得的成果^。巧用的内容外,本论文不含巧何其他个人或集体己经发
3、表或撰写过的作品或成明。,己中u明确方式标本声明的出重要贡献的个人和集体均化文t对本文研究做。的法律结果由本人承化一因而人承诺木内容致。如不符引:已提交的论文电子版与论文纸的木学位。上由的学术声誉的损失人自负起本曰:曰论:签字年月学文作者期位)/^/兴^至争海学位论文出版授权书本人完全同意《中国优秀博硕±学位论文全文數据库出販章程》""(从下简祿章程),愿意将本人的硕±学位论文提交中国学术期刊(光盘版)电子杂志社在《中国优秀博硕:t学位论文全文数据库》中全文发表。《中国优秀博硕±学位论文全文数据库》可料电子、网络及其他数字
4、媒体形式公开巧版,并同意编入CMI《中国知识资源总库》,在《中国博硕±学位论文评价数据库》中使用和在互联网""上传播,同意按章程规定享受相关权益。海作者签名:^洋[!>生jL瓦之亡円>.论文题目:K鼠庄-爲香ii班雜嚴晕成,凉^喪办三、:毕业院校:网川师范大学毕业年份M毕1n’本:]扳所在学院:所学专化计窜换丘f说明。:木授权书由中国学术期刊C光盘版)电子杂志社保任:01062791814联系电话:010627919516279317662790糾3传真8448:100084遥信地址:北京清华大学邮局信
5、箱采编中如邮编协同过滤推荐算法研究及MapReduce实现计算机应用技术专业研究生王书海指导教师郭涛摘要随着互联网技术的高速发展,数据信息呈现出爆炸式增长,互联网将人类带入了大数据时代。用户要在海量数据中挑选出自己真正需要的信息好比大海捞针,如何在众多信息中迅速挖掘用户感兴趣的关键信息并推送给用户,成为当下学界和业界共同关注的热点问题。近年来,推荐系统作为一种智能的个性化信息服务技术在国内外得到迅速崛起,并在电子商务、视频娱乐、社交网络等多个领域得到广泛应用。经过多年的发展,推荐系统已经衍生出基于内容的推荐、基于数据挖掘的推荐、协同过滤推荐等多种推荐技术。其中,
6、协同过滤推荐技术是应用最为广泛的推荐技术。但是,协同过滤推荐算法存在着数据稀疏、推荐精度低等问题,特别在大数据背景下,协同过滤推荐算法的数据稀疏问题、推荐精度问题被进一步放大,使之成为推荐系统的发展和应用的瓶颈。基于此,本文完成了如下工作:第一,针对协同过滤推荐系统中的数据稀疏性问题,提出了基于专家用户和项目信任度的数据填充方法。该方法根据专家信任度值,选择评分数量多、评分质量好的用户作为专家用户。同时,该方法综合考虑项目评分数和标准差作为项目信任度的评估值,使信任度高的项目作为可行项目,并采用专家用户的评分对高信任度项目的缺失项进行填充,从而在保证填充质量的前提
7、下有效降低数据的稀疏度,并通过实验验证该算法的有效性。第二,结合K-Means算法和基于项目的协同过滤推荐算法,提出了基于聚类和非对称权重混合相似度的协同过滤推荐算法(CFCA)。该算法首先完成了基于评分稳定项目的K-Means聚类,然后在类中采用非对称权重混合相似度进行相似度计算,并据此给出推荐结果。该算法综合考虑项目之间共同用户评分的交叠状况和项目的评分数,提高了相似度计算的准确性,进而提高推荐质量。针对本文提出的算法,论文完成了在不同条件下CFCA算法与传统协同过滤推荐算法的实验对比。实验结果表明,本文提出的算法,能够有效的提高算法的推荐精度。第三,为提高算
8、法效率、降
此文档下载收益归作者所有