欢迎来到天天文库
浏览记录
ID:37032390
大小:1.60 MB
页数:65页
时间:2019-05-17
《基于强化学习的电影推荐算法应用与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号学号M201676099学校代码10487密级硕士学位论文基于强化学习的电影推荐算法应用与实现学位申请人:谈凯学科专业:软件工程指导教师:黄晓涛教授答辩日期:2018.12.18AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringApplicationandImplementationofMovieRecommendationAlgorithmBasedonReinforcementLe
2、arningCandidate:TanKaiMajor:SoftwareEngineeringSupervisor:ProfessorHuangXiaotaoHuazhongUniversityofScienceandTechnologyWuhan430074,P.R.ChinaDecember,2018华中科技大学硕士学位论文摘要随着移动互联网的快速发展和网络速度的提升,互联网用户对于网上观看电影的需求越来越丰富,电影网站的电影数量持续增长,用户找到感兴趣电影的难度逐渐增加。不断发展的推荐算法,在一定程度上解
3、决了电影的信息过载问题,给用户推荐的电影准确率较高,但大部分线下训练模型的推荐使用固定的推荐策略,缺乏动态性和灵活性,无法感知用户兴趣的变化,推荐结果的相似度高,多样性差,难以满足用户动态变化的兴趣,不能完全发挥推荐系统的价值。因此,设计多样性好的推荐算法,并应用于电影推荐系统具有实际应用价值。根据用户对电影评分行为的稀疏度高和用户的观看电影兴趣随时间动态变化等特点,提出基于强化学习的电影推荐算法,并应用于电影推荐原型系统。用强化学习框架对电影推荐过程进行马尔可夫决策过程建模,模拟推荐系统根据用户不同的状态采取
4、不同的推荐动作,采用因子分解机和非线性多层感知机为核心的深度Q网络作为动作值函数的近似计算,通过值函数选择最优候选电影,并引入ℇ-greedy随机策略作为最后的推荐结果,进一步提高多样性。训练深度Q网络采用经验回放技术,将用户观看电影状态、电影推荐动作、奖励和新的用户状态作为样本保存到经验池,从经验池随机取出部分样本进行监督训练。强化学习算法在电影推荐过程中考虑了用户的动态兴趣,有助于提升推荐结果的多样性。在MovieLens数据集上进行TopN推荐实验表明,当推荐电影数量较多时,基于强化学习的电影推荐算法能够
5、在保证推荐的准确率基础上,整体多样性相比传统的协同过滤算法和linUCB、协同过滤混合算法有所提升。关键词:电影推荐系统因子分解模型马尔可夫决策过程强化学习I华中科技大学硕士学位论文AbstractThedemandsofinternetusersonmoviesareincreasing,withtherapiddevelopmentofmobileInternetandtheincreaseofnetworkspeed.Thenumberofmoviesonmoviewebsiteswascontinuou
6、slyincreasing,whichmadeitdifficultforuserstofindmoviesofinterest.Theevolvingrecommendationalgorithmsolvestheinformationoverloadproblemofthemovietoacertainextent,whichaccuratelyrecommendedmoviesfortheusers.Mostoftheofflinemodelswithafixedrecommendationstrateg
7、ycan’tperceivethechangesofuserinterest.Highsimilarityandpoordiversityofrecommendationcannotmeettheusers'dynamicinterest.Thevalueoftherecommendationsystemisnotfullyutilized.Therefore,itisvaluabletodesignarecommendationalgorithmwithdiversityandappliedtothefilm
8、recommendationsystem.Afilmrecommendationalgorithmbasedonreinforcementlearningisproposedandappliedtothemovierecommendationprototypesystem,accordingtotheuser'shighdegreeofsparsenessonthefilm'sscor
此文档下载收益归作者所有