欢迎来到天天文库
浏览记录
ID:35066029
大小:2.46 MB
页数:67页
时间:2019-03-17
《基于时间因子的分布式协同过滤系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于时间因子的分布式协同过滤系统研究林娴斐2016年1月中图分类号:TP393UDC分类号:004.9基于时间因子的分布式协同过滤系统研究作者姓名林娴斐学院名称计算机学院指导教师宿红毅副教授答辩委员会主席蔡继红研究员申请学位工学硕士学科专业计算机科学与技术学位授予单位北京理工大学论文答辩日期2016年1月TheResearchofTimeWeightDistributedCollaborativeFilteringSystemCandidateName:XianfeiLinSchoolorDepartment:ComputerSciencea
2、ndTechnologyFacultyMentor:A.Prof.HongyiSuChair,ThesisCommittee:Prof.JihongCaiDegreeApplied:MasterofScienceMajor:ComputerScienceandTechnologyDegreeby:BeijingInstituteofTechnologyTheDateofDefence:January,2016研究成果声明本人郑重声明:所提交的学位论文是我本人在指导教师的指导下进行的研究工作获得的研究成果。尽我所知,文中除特别标注和致谢的地方外
3、,学位论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得北京理工大学或其它教育机构的学位或证书所使用过的材料。与我一同工作的合作者对此研究工作所做的任何贡献均已在学位论文中作了明确的说明并表示了谢意。特此申明。签名:日期:北京理工大学硕士学位论文摘要随着信息过载的现象的出现,一种有效解决信息过载,向用户提供他们感兴趣或有需求的信息的引擎被迫切需要。个性化推荐技术应运而生,推荐系统通过分析用户历史行为,为用户画像,建立用户的兴趣模型,以此来为用户推荐满足他们需求和兴趣的信息,一个好的推荐系统是能在短时间内为用户提供感兴趣的信息的系统。
4、协同过滤推荐算法虽然是最成功的推荐算法之一,数据量不断以指数级增长,传统的协同过滤推荐算法面临着精度、扩展性、冷启动等挑战。本文提出了基于时间因子的分布式协同过滤推荐系统,系统主要在两个方面进行了优化。一个是算法优化,一个是速度优化。整个系统流程分为三个部分:用户的登录预测部分,推荐部分,个性化推荐的评估部分。1)在用户的登录预测部分,根据对用户的历史登录数据的分析,预测用户在某一天的登录情况。该部分将用户分为两种类型:当天将会登录的用户和当天不会登录的用户。对预测将登录的用户做出个性化推荐,对预测不登录的用户推荐热门项目。2)推荐部分分为个
5、性化推荐和热门项目推荐。个性化推荐中采用基于项目的协同过滤推荐,推荐过程主要分为:两种相似度加权融合的相似度计算、评分的时间衰减和生成推荐列表。热门推荐中,将项目按受欢迎程度排序,直接向用户推荐最受欢迎的若干个项目。3)基于时间因子的分布式协同过滤系统在实际场景中的应用,使用相关数据集对系统完成具体实现,从电影推荐系统的业务需求入手,分析系统在实际业务场景下的工作性能,并对其推荐性能进行评估。通过相似度计算的优化和对旧数据的时间衰减,推荐的精度得到了提高。同时,系统的扩展性问题得到了很大的改善。关键词:协同过滤推荐;时间因子;相似度计算;分布
6、式计算I北京理工大学硕士学位论文AbstractWiththeemergenceoftheinformationoverloading,anenginewhichcouldeffectivelysoluteinformationoverloadingandprovidetheuserswiththeirrequiredinformationisurgentlyneeded.Thus,personalizedrecommendationtechnologycameintobeing.Therecommendationsystemrecommen
7、dedforuserstomeettheirinformationneedsandinterestsbyanalyzingusers’behaviorhistory,agoodrecommendationsystemisasystemthatprovidesinformationtomeettheusers’interestsinashortterm.Whiletheamountofdatacontinuestogrowexponentially,thetraditionalcollaborativefilteringalgorithmfac
8、edwithchallengesaboutaccuracy,scalability,coldstartandothers.Inthispaper,wepropose
此文档下载收益归作者所有