基于用户评论的推荐系统设计与实现

基于用户评论的推荐系统设计与实现

ID:37062832

大小:3.26 MB

页数:62页

时间:2019-05-16

基于用户评论的推荐系统设计与实现_第1页
基于用户评论的推荐系统设计与实现_第2页
基于用户评论的推荐系统设计与实现_第3页
基于用户评论的推荐系统设计与实现_第4页
基于用户评论的推荐系统设计与实现_第5页
资源描述:

《基于用户评论的推荐系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、工程硕士学位论文基于用户评论的推荐系统设计与实现作者姓名张展鸿学科专业计算机技术校内指导教师许洁斌高级工程师校外指导教师郭炜强高级工程师所在学院计算机科学与工程学院论文提交日期2018年4月DesignandImplementationofRecommendationSystemBasedonUserReviewsADissertationSubmittedfortheDegreeofMasterCandidate:ZhangZhanHongSupervisor:Sr.EngineerXuJieBinSouthChi

2、naUniversityofTechnologyGuangzhou,China分类号:TP3学校代号:10561学号:201521031911华南理工大学硕士学位论文基于用户评论的推荐系统设计与实现作者姓名:张展鸿指导教师姓名、职称:许洁斌高级工程师申请学位级别:工程硕士学科专业名称:计算机技术论文形式:产品研发工程设计应用研究工程/项目管理调研报告研究方向:服务计算与工程论文提交日期:2018年4月20日论文答辩日期:2018年6月1日学位授予单位:华南理工大学学位授予日期:年月日答辩委员会成员:主席:李

3、克秋委员:余志文刘发贵张星明董守玲摘要随着信息技术的发展和互联网的普及,信息过载问题日益严重,推荐系统的出现是解决这类问题的有效工具,通过用户的已有历史自动从海量数据中发现满足用户需求的信息并进行推荐,提高了人们对信息获取的效率。协同过滤算法是推荐算法中最为重要并且得到广泛应用的算法之一,但传统的算法在用户量以及物品量过大的情况下,会出现矩阵稀疏问题,这直接影响着算法计算的精确度以及运行效率。近年来随着文本处理技术的提升,越来越多的研究者们通过从用户评论入手,来获得用户和物品的特征,从而提高算法的准确度。本文主要通过

4、用户的评论信息,针对传统协同过滤算法的稀疏性问题提出了一种改进方法。其中主要包括以下几方面的工作:分析目前推荐算法的研究现状及存在的问题,针对传统基于物品的协同过滤算法矩阵稀疏问题,通过用户评论集,利用LDA主题概率模型对物品的评论集进行主题概率分布的计算,将得到的物品关于主题分布的概率作为物品的特征,通过计算物品之间关于特征向量的余弦相似度来获得物品间的相似程度,从而根据物品相似度,通过用户的历史评分数据来对未评分物品进行评分预测。在计算物品关于主题的概率分布时,通过对每条评论加入用户评分以及评论时间权重,来提高物

5、品特征计算的准确性,另外考虑到没有获得评论的物品将无法计算其特征向量,提出了通过加入物品的简介信息作为物品的一条评论,从而可以得到关于物品的更多描述信息,以提高物品特征计算的准确性和全面性。通过Spark大数据平台完成系统的实现,基于分布式计算平台设计系统架构,完成推荐算法的处理流程,并通过Web端程序开发用户交互页面,实现推荐结果的输出展示。最后通过设计实验,以亚马逊电子产品类评论数据集作为测试,对本文算法与传统基于物品的协同过滤算法进行性能比对。通过实验结果表明,本文提出的算法相比传统算法性能得到了提高,主要原因

6、是充分利用了评论信息,从而提高了预测的准确度。关键词:推荐系统;协同过滤;主题模型;SparkIAbstractWiththeboomingofinformationtechnologyandtheincreasingpopularityoftheInternet,theproblemofinformationoverloadisbecomingmoreandmoreserious.Recommendationsystemisaneffectivetoolforsolvingsuchproblems.Itcanaut

7、omaticallydiscoveredfrommassivedataandrecommendsomethingthatuserneeds.Enhancetheefficiencyofpeople'saccesstoinformation.Collaborativefilteringalgorithmisoneofthemostimportantandwidelyusedalgorithms.However,thematrixsparseproblemwilloccurwhentherearetoomanyusera

8、nditem,whichdirectlyreducetheaccuracyandtheperformanceofthealgorithm.Inrecentyears,withtheimprovementoftextprocessingtechnology,moreandmoreresearchershavebeguntouseuserrevie

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。