基于概率矩阵分解的推荐算法研究

基于概率矩阵分解的推荐算法研究

ID:33148540

大小:1.88 MB

页数:70页

时间:2019-02-21

基于概率矩阵分解的推荐算法研究_第1页
基于概率矩阵分解的推荐算法研究_第2页
基于概率矩阵分解的推荐算法研究_第3页
基于概率矩阵分解的推荐算法研究_第4页
基于概率矩阵分解的推荐算法研究_第5页
资源描述:

《基于概率矩阵分解的推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海交通大学硕士学位论文基于概率矩阵分解的推荐算法研究硕士研究生:涂世涛学号:1110329019导师:朱兰娟副导师:申请学位:工学硕士学科:控制科学与工程所在单位:电子信息与电气工程学院自动化系答辩日期:2013年2月授予学位单位:上海交通大学万方数据DissertationSubmittedtoShanghaiJiaoTongUniversityfortheDegreeofMasterResearchonProbabilisticMatrixFactorizationBasedRecommendatio

2、nAlgorithmCandidate:ShitaoTuStudentID:1110329019Supervisor:Prof.LanjuanZhuAssistantSupervisor:AcademicDegreeAppliedfor:MasterofEngineeringSpeciality:ControllingScienceandEngineeringSchoolofElectronicInformationandAffiliation:ElectricalEngineeringDateofDefe

3、nce:Feb,2014Degree-Conferring-Institution:ShanghaiJiaoTongUniversity万方数据万方数据万方数据上海交通大学硕士学位论文基于概率矩阵分解的推荐算法研究摘要推荐系统是信息过滤系统中的一种特殊形式,通过分析用户的历史兴趣和偏好信息,在项目空间中确定用户现在或者将来可能会喜欢的项目,进而主动向用户提供相应的项目推荐服务。随着互联网信息量的快速增长和人们希望有效获取感兴趣信息的需求日益明确,推荐系统在国内外也逐渐引起了业界和学术界的广泛关注和研究。推荐

4、算法作为机器学习、数据挖掘领域的一项研究热点,其中有效数据的稀疏性,大量用户和推荐项目没有历史评价记录,以及推荐精准性和多样性之间的平衡是推荐算法研究中的难点。本文首先介绍了推荐算法领域经典的协同过滤方法和近年来热门的矩阵分解算法以及其加入信任网络传播的模型,为了整合来自各数据源的海量的原始数据,讨论了对各推荐应用场景下数据模型进行清洗,整合归一化的ETL方法,和该ETL过程中的容错算法。提出了推荐系统海量数据条件下的更新策略,以及ETL错误快速恢复算法的配置和日志设计,为后续推荐算法的有效应用提供了必要的

5、数据准备。随后,针对目前推荐系统中冷启动用户问题,本文尝试对常用的推荐算法作一定的改进,通过对推荐过程的多臂赌博机(bandit)方法建模,评价前N次推荐序列的准确性。具体而言,本文采用最大化置信上界(UCB)作为bandit决策的标准产生推荐,同时引入概率矩阵分解算法通过随机梯度下降法能学习得到用户、项目的后验概率,直接带入UCB决策方程实现了推荐与学习的同步。此外,本文还应用了基于贝叶斯概率矩阵和基于变分贝叶斯方法的置信上界多臂赌博机推荐算法,分别从随机和定量的角度解决概率矩阵分解中参数整定困难的不足,

6、并直接通过迭代中间变量估计评分值得统计量。此外,本文通过I万方数据上海交通大学硕士学位论文MovieLens和Netflix公开数据集对提出的算法做了离线验证,结果显示它们有效的提升了冷启动用户条件下的推荐准确度。为使推荐算法更好地运用于实际系统,本文在验证结果的基础上进一步分析了模型参数对于推荐结果的影响以及不同数据环境下的参数优化组合。最后,本文给出了基于所提出ETL容错策略和推荐算法的系统设计实现架构和主要技术。关键词:推荐算法,ETL,概率矩阵分解,多臂赌博机II万方数据上海交通大学硕士学位论文Re

7、searchonProbabilisticMatrixFactorizationBasedRecommendationAlgorithmABSTRACTRecommendationsystemisaspecifickindofinformationfilteringsystem.Byanalyzingusers’pastbehavioraldataandpreference,thesystempredictsitemswhichwillprobablymeetwithuserinterest,andreco

8、mmendsthoseitemorservicetoendusers.Intheageofrapidgrowinginternet,thedemandforinformationisbecomingpersonalizedanddiversifiedwhichleadstotheresearchofrecommendationsystempopular.Recommendationhasbeenahotresea

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。