欢迎来到天天文库
浏览记录
ID:35066214
大小:5.15 MB
页数:59页
时间:2019-03-17
《基于有限混合模型的协同过滤算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广东工业大学硕±学位论文(工学硕±)基于有限混合模型的协同过滤算法硏究王旭彬-二〇—六年五月二、■_圓圓.11:845分类号:学校代码2111305033UDC:学号::密级广东工业大学硕±学位论文(工学硕±)基于有限混合模型的协同过滤算法硏究王旭彬指导教师姓名、职称:陈平华教授学科:计算机科学与技术(专业)或领域名称学生所属学院:计算机学院—论文答辩日期:二〇六年五月ADissertationSubmitedtoGuangdo
2、ngUniversitofTechnoloygyfortheDereeofMasterg(Masterof£nginecri打gScic打ce)ResearchoncollaborativefilteringalorithmbaseongmutialfinitixuremodellinomemtCand-idate:WangXubin-Suervisorhuap:P姑Chen円ngMa2016ySchoolofComputerScience&T
3、echnologyGuangdongUniversityofTechnologyGuanzhouGuandonP.R.Ch510006inag,gg,,摘要摘要在信息互联网高度发达的今天,解决信息过载问题已经成为互联网技术发展的方一向之,而个。如何从网络海量信息中获取有价值的信息是研巧信息过载问题的关键性化推荐作为解决此问题的关键技术,具有重要的学术意义和应用价值。协同过滤及协同过滤的各种衍生算法(iA其不依赖于信息的具体内容、易于实施、可W产生新异一推荐等特性被大量的互联网企业
4、所采用,并成为个学术研究热点。针对基于存储的SlopeOne模型的准确度和扩展性缺陷问题,本文研究基于模型的协同过滤算法,W有限混合模型为基础,结合传统SlopeOne协同过滤技术,探索新型个性化推荐方法,具体包括W下研究内容:首先,介绍了有限混合模型的统计学原理、概念和特点,详细推导其求解的算法;介绍了个性化推荐的基础概念与发展现状,分析协同过滤算法的几个常用方法的优缺点,W及有限混合模型在协同过滤上应用的优势,总结了近年来国内外学者们所做的相关工作。其次,本文利用多项式有限混合模型对数据集进行基
5、于模型的聚类,通过引入最小信息长度法则(minimalmessagelengthcriterion,MML)W缩小有限混合模型的求解迭代次数,并将聚类结果应用于Slope日ne平均评分偏差的改良上,从而改善了SlopeOne算法由于缺乏用户相似考虑导致的准确度问题。同时由于将整个推荐方案分为离线聚类和在线推荐两部分,极大地改进了SlopeOne的可扩展性。使用标准数据集进行模拟实验,评估新算法的准确度与效率指标,相比于标准的Slopeone和基于用户聚类的Slopeone,改进算法推荐的准确
6、度大幅提升。最后,鉴于目前互联网企业的数据存量己经远远超出单机可计算的极限,本文设计了基于多项式有限混合模型的SlopeOne改进算法的MapReduce实现。通过实验验证了基于多项式有限混合模型的SlopeOne改进算法的MapReduce实现的算法有效性和算法对比单机算法的效率提升,并通过加速比的变化说明了算法的可扩展性。SloOHadoo关键词:协同过滤;有限海合模型;pene;MapReduce:pIABSTRACTABSTRACTWi1:h化erapiddevelopm
7、entoftheInternet,化einformatio打overloadof化eI打temethasbecomeanimportant过iscussio打topic.Thekeyissueofstudinthistoicishowtofilterygpoutthevahiableinformationfromthemassinformation.Tosolvethisroblemthep,personalizedrecomme打datio打sh
8、owsitsacademicsigni打canoeandp巧cticalvalueasakindofketechnolo.Collaborativefilterinandcollaborat
此文档下载收益归作者所有