基于改进K-means聚类和RBM的协同过滤算法

基于改进K-means聚类和RBM的协同过滤算法

ID:37065428

大小:1.21 MB

页数:62页

时间:2019-05-16

基于改进K-means聚类和RBM的协同过滤算法_第1页
基于改进K-means聚类和RBM的协同过滤算法_第2页
基于改进K-means聚类和RBM的协同过滤算法_第3页
基于改进K-means聚类和RBM的协同过滤算法_第4页
基于改进K-means聚类和RBM的协同过滤算法_第5页
资源描述:

《基于改进K-means聚类和RBM的协同过滤算法》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP301.6单位代码:10183基研究生学号:2015534021密级:公开于改进K-means聚类和RB吉林大学M的协硕士学位论文同过滤(专业学位)算法基于改进K-means聚类和RBM的协同过滤算法CollaborativeFilteringRecommendationAlgorithmBasedonImprovedK-meansClusteringAlgorithmandRBM耿瑞作者姓名:耿瑞类别:工程硕士领域(方向):计算机技术吉指导教师:董立岩教授林大培养单位:计算机科学与技术学院学2018年4月基于改进K-means聚类和RBM的协同过滤算法Colla

2、borativeFilteringRecommendationAlgorithmBasedonImprovedK-meansClusteringAlgorithmandRBM作者姓名:耿瑞领域(方向):计算机技术指导教师:董立岩教授类别:工程硕士答辩日期:年月日未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学硕士学位论文原创性声明本人郑重声明:所呈交的硕士学位论文,是本人在指导教师

3、的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日《中国优秀博硕士学位论文全文数据库》投稿声明研究生院:本人同意《中国优秀博硕士学位论文全文数据库》出版章程的内容,愿意将本人的学位论文委托研究生院向中国学术期刊(光盘版)电子杂志社的《中国优秀博硕士学位论文全文数据库》投稿,希望《中国优秀博硕士学位论文全文数据库》给予出版,并同意在《中国博硕士学位论文评价数据库》和CN

4、KI系列数据库中使用,同意按章程规定享受相关权益。论文级别:■硕士□博士学科专业:计算机技术论文题目:基于改进K-means聚类和RBM的协同过滤算法作者签名:指导教师签名:年月日作者联系地址(邮编):吉林省长春市前进大街2699号吉林大学前卫南区计算机科学与技术学院130012作者联系电话:15543008736摘要摘要基于改进K-means聚类和RBM的协同过滤算法随着互联网的发展和网络的普及,海量信息应运而生,世界进入了一个大数据的时代。面对着目不暇接、过载的信息量,如何更加有效的获取有用的信息,寻找自己感兴趣的信息成为了一个新的并且亟待解决的问题。当人们主动想查找信息

5、时,搜索引擎可以在一定程度上解决用户的需求,可是并不是最好的方案,一方面当无法准确的描述关键词的时候,搜索的结果会大打折扣;另一方面,无法满足人们希望被动的获取和推送的信息的目的。推荐系统的产生革命性的提供了一种很好的解决方案。它可以通过推荐算法根据用户的历史行为分析,建立模型,从而主动推送给用户感兴趣的信息。推荐系统已经广泛的应用于各个领域,比如电商网站的商品推荐,音乐和电影的推荐,新闻资讯的推荐等。这项技术的应用一方面可以提高系统的用户体验,增加用户对系统的黏性;另一方面也能够借此吸引更多的用户。一个推荐系统的核心在于采用了什么样的推荐算法,在这个领域的研究中主要针对推荐

6、算法的改进和优化。现阶段,推荐算法种类较多,我们可以将其分为包括基于内容的推荐算法等在内的三种算法,其中基于协同过滤的推荐算法是其中使用最广,最受欢迎的算法,其利用用户历史对项目的评分生成项目评分矩阵,并计算用户或者项目的相似度进行推荐,但是存在数据稀疏、对于新用户和新项目的冷启动问题和扩展性差的问题,无法满足业务的需要和互联网的发展。而随着机器学习技术的发展和完善,传统的推荐系统与机器学习的结合也使推荐的效果得以大大提升。本文为了解决上述问题,做出了一定的改进,主要包括两个方面的内容:首先,传统的K-means算法在计算相似度时使用欧式距离,存在弊端,导致聚类结果不够准确。

7、本文在计算用户之间的相似度的过程中引入信任关系和时间衰减,既考虑了评分的影响,也考虑了信任关系和兴趣变化,可以得到更好更符合真实情况的聚类结果。在结合聚类结果找到相似度最高的最近邻居,根据相似度进行加权计算预测评分。I摘要其次,受限玻尔兹曼机RBM模型应用在协同过滤问题上取得了不错的结果,本文将RBM模型和经过改进的K-means算法得到的预测结果进行融合,一方面通过改进的K-means算法进行聚类将用户划分成不同的簇,当预测评分时先判断所属的簇,可以在一定程度上减少计算量,提高算法的效率;另一方面RB

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。