欢迎来到天天文库
浏览记录
ID:35069665
大小:5.54 MB
页数:65页
时间:2019-03-17
《基于聚类的协同过滤推荐算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广东工业大学硕±学位论文(工学硕±)基于聚类的协同过滤推荐算法研究陈传瑜二〇—六年五月分类号:学校代号:11845UDC:密级:学号:2。1305023广东工业大学硕±学位论文(王学硕±)基于聚类的协同过滤推荐算法研究陈传瑜指导教师姓名、职称:陈平华教授学科专业或领域名称:计算机科学与技术()学生所属学院:计算机学院—论文答辩日期:二〇六年五月ADissertationSubmittedtoGuandongUniversitof
2、gyTechnolofortheDereeofMast巧gyg(MasterofEnineerinScience)ggResearchofCollaborativeFilteringRecommendationAlgori化m目asedonClusteringMe1;hodsCandidate:ChenChuanuySuervisor:Prof.ChenPinhuapgMa2016ySchoolofihnoloComputerScenc
3、eandTecgyGua打gdo打gU打iversitofTechnoloygyGuanzhouGuando打P.■艮China510006g,g呂,,摘要摘要随着Internet和移动终端快速发展和迅速普及,互联网数据呈爆炸性地增长,出现""了信息过载问题。如何在海量数据里找到用户真正感兴趣的信息并将其推荐给用户成为了业界研巧的热点。推荐系统能帮助用户挖掘海量数据里深层次潜在的信息,帮助用户快速获取需要的内容,从而被广泛应用=协同过滤是当前较成功的推荐算法一,,其
4、简单的模型概念和实现过程备受大型企业青睐之。但是协同过滤也存在着冷启动、数据稀疏、计算效率tiA及系统可扩展性等方面的问题。针对协同过滤存在的冷启动和数据稀疏问题,本文引入李德毅院±提出的5模型概念。云模型属于不确定人王智能领域,主要是将多维向量映射至H维向量,使用期望、滴和超煽等数学特征进行量化,这也使得问题从局部扩展到全局,从而降低数据一稀疏和冷启动带来的负面影响,。另外本文结合云模型提出种改进的相似度计算模型,,,该计算模型可レッ更好地描述用户(项目)间的相似性。最后在计算云特征时还考
5、虑用户的偏好因素,如时间因素、评分因素等。针对协同过滤存在的系统计算效率一二叉树的、可扩展性问题,本文提出种基于聚类算法,。协同过滤计算效率低下的原因是在计算最近邻时需计算目标用户与所有,从而获得与目标用户最相似的用户集用户的相似性。因此使用聚类算法减少近邻比-‘,较次数成为研究热点。KMeans算法不仅受限于初始中。和K值的设定而且还存在一用户不能同归属于多类别等方面的问题,故本文提出种改进聚类算法。其主要是将一二叉K-Means相结合数据结构树和聚类算法,形成种新的层次聚类算法。二叉树的
6、聚一最后,本文将基于类算法和云模型相融合,形成种基于聚类的改进推荐算法,。在计算过程中由于结点之间的无关联性本文引入基于内存的分布式计算Sark,框架,并将本文算法在该平台上并行实现本文算法不仅可提升p。经由实验证明,还能够通过并行化从而提高系统可扩展性准确性。,本文在模拟现实集群环境下,对提出的基于聚类的协同过滤算法进行测试主要是用于评估推荐算法的稳定性、准确性W及响应时间,为该推荐算法进行了比较科学有效的评估。对比实验结果发现,本文提出的基于聚类的协同过滤算法在稳定性、精确性,、高效性W
7、及可扩展性等方面均表现优异满足算法要求。二叉过滤S关键词:云模型;树;协同;聚类算法;parkIABSTRACTABSTRACTWiththerapiddevelopmenta打doularizationoftheInternetandMobUeTerminals,ppInternetinformationcontentrenderexonentiallsureichwillalsowhleadtothepyg,*informatio打ove
8、rloadproblem.Howtofmdusersreallyin化ie巧edi打hugeamountsofdatainformatio打andrecommendittotheuserhasbecomeahotresearchintheindustry.民sthl
此文档下载收益归作者所有