基于强化学习的电影推荐算法应用与实现

基于强化学习的电影推荐算法应用与实现

ID:37032390

大小:1.60 MB

页数:65页

时间:2019-05-17

基于强化学习的电影推荐算法应用与实现_第1页
基于强化学习的电影推荐算法应用与实现_第2页
基于强化学习的电影推荐算法应用与实现_第3页
基于强化学习的电影推荐算法应用与实现_第4页
基于强化学习的电影推荐算法应用与实现_第5页
资源描述:

《基于强化学习的电影推荐算法应用与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号学号M201676099学校代码10487密级硕士学位论文基于强化学习的电影推荐算法应用与实现学位申请人:谈凯学科专业:软件工程指导教师:黄晓涛教授答辩日期:2018.12.18AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringApplicationandImplementationofMovieRecommendationAlgorithmBasedonReinforcementLe

2、arningCandidate:TanKaiMajor:SoftwareEngineeringSupervisor:ProfessorHuangXiaotaoHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaDecember,2018华中科技大学硕士学位论文摘要随着移动互联网的快速发展和网络速度的提升,互联网用户对于网上观看电影的需求越来越丰富,电影网站的电影数量持续增长,用户找到感兴趣电影的难度逐渐增加。不断发展的推荐算法,在一定程度上解

3、决了电影的信息过载问题,给用户推荐的电影准确率较高,但大部分线下训练模型的推荐使用固定的推荐策略,缺乏动态性和灵活性,无法感知用户兴趣的变化,推荐结果的相似度高,多样性差,难以满足用户动态变化的兴趣,不能完全发挥推荐系统的价值。因此,设计多样性好的推荐算法,并应用于电影推荐系统具有实际应用价值。根据用户对电影评分行为的稀疏度高和用户的观看电影兴趣随时间动态变化等特点,提出基于强化学习的电影推荐算法,并应用于电影推荐原型系统。用强化学习框架对电影推荐过程进行马尔可夫决策过程建模,模拟推荐系统根据用户不同的状态采取

4、不同的推荐动作,采用因子分解机和非线性多层感知机为核心的深度Q网络作为动作值函数的近似计算,通过值函数选择最优候选电影,并引入ℇ-greedy随机策略作为最后的推荐结果,进一步提高多样性。训练深度Q网络采用经验回放技术,将用户观看电影状态、电影推荐动作、奖励和新的用户状态作为样本保存到经验池,从经验池随机取出部分样本进行监督训练。强化学习算法在电影推荐过程中考虑了用户的动态兴趣,有助于提升推荐结果的多样性。在MovieLens数据集上进行TopN推荐实验表明,当推荐电影数量较多时,基于强化学习的电影推荐算法能够

5、在保证推荐的准确率基础上,整体多样性相比传统的协同过滤算法和linUCB、协同过滤混合算法有所提升。关键词:电影推荐系统因子分解模型马尔可夫决策过程强化学习I华中科技大学硕士学位论文AbstractThedemandsofinternetusersonmoviesareincreasing,withtherapiddevelopmentofmobileInternetandtheincreaseofnetworkspeed.Thenumberofmoviesonmoviewebsiteswascontinuou

6、slyincreasing,whichmadeitdifficultforuserstofindmoviesofinterest.Theevolvingrecommendationalgorithmsolvestheinformationoverloadproblemofthemovietoacertainextent,whichaccuratelyrecommendedmoviesfortheusers.Mostoftheofflinemodelswithafixedrecommendationstrateg

7、ycan’tperceivethechangesofuserinterest.Highsimilarityandpoordiversityofrecommendationcannotmeettheusers'dynamicinterest.Thevalueoftherecommendationsystemisnotfullyutilized.Therefore,itisvaluabletodesignarecommendationalgorithmwithdiversityandappliedtothefilm

8、recommendationsystem.Afilmrecommendationalgorithmbasedonreinforcementlearningisproposedandappliedtothemovierecommendationprototypesystem,accordingtotheuser'shighdegreeofsparsenessonthefilm'sscor

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。