基于项目和用户双重聚类的协同过滤推荐系统

基于项目和用户双重聚类的协同过滤推荐系统

ID:5356597

大小:687.47 KB

页数:15页

时间:2017-12-08

基于项目和用户双重聚类的协同过滤推荐系统_第1页
基于项目和用户双重聚类的协同过滤推荐系统_第2页
基于项目和用户双重聚类的协同过滤推荐系统_第3页
基于项目和用户双重聚类的协同过滤推荐系统_第4页
基于项目和用户双重聚类的协同过滤推荐系统_第5页
资源描述:

《基于项目和用户双重聚类的协同过滤推荐系统》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、泰迪华南杯数据挖掘竞赛论文报告基于项目和用户双重聚类的协同过滤推荐系统摘要:随着互联网技术的迅猛发展,人们逐渐走入了信息过载的时代。面对大量的信息,我们都显得有些无所适从。作为信息需求者,从大量信息中找到自己感兴趣的信息往往是一件非常困难的事情;而对于信息提供者,让自己的信息脱颖而出,受到大家的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统通过建立用户和信息产品之间的关系,利用已有的选择过程或相似性关系,一方面挖掘用户潜在感兴趣的信息,另一方面让信息能够展现在对它感兴趣的用户面前。协同过滤技术是目前推荐系统中应用最早和最为成功的技术之一,其发展面临着两个三个

2、主要挑战:提高协同过滤算法的可扩展性;降低推荐系统数据集的稀疏性;提高推荐质量。针对这些问题本文提出一个改进的协同过滤算法——基于用户和项目双重聚类的协同过滤推荐算法。利用评分数据稀疏差异度和项目类别构造集合差异度度量公式,用以在用户-项目评分矩阵上进行项目聚类,解决了协同过滤推荐算法在面临高维数据稀疏特征时推荐效果差的难题;同时采用经典的K-means聚类方法对用户进行聚类,具有简单快速适于处理大数据的优点,省去了规范化处理。实验结果表明,此算法拥有基于用户聚类的协同过滤算法和基于项目聚类的协同过滤算法的优点,并摒弃了其缺点。关键词:推荐系统、协同过滤、IBCRA项目聚类、双重聚类、

3、综合推荐第1页,共15页泰迪华南杯数据挖掘竞赛论文报告ThethesistitleAbstract:WiththerapiddevelopmentofInternettechnology,peoplegraduallygetintotheageofinformationoverload.Facedwithalotofinformation,weareabitconfused.Asthepeoplewhoneedinformation,it’saverydifficultthingtofindtheinformationtheyareinterestedinfromalotofinfor

4、mation;whileforinformationproviderstomaketheirmessagestandoutisalsoaverydifficultthing.Recommendationsystemisanimportanttooltoresolvethiscontradiction.Recommendedsystemthroughtheestablishmentofrelationshipsbetweenusersandinformationproducts,usingtheexistingselectionprocessorsimilarrelationship,o

5、ntheonehandmininginformationofinteresttopotentialusers,ontheotherhandsothatinformationcanbedisplayedinfrontoftheuserinterestedinit.Collaborativefilteringtechnologyisoneofthemaintechnologiesfortherecommendationsystemine-commercewhichhasapplicationoftheearliestandismostsuccessful.However,ithastwop

6、roblems:thelackofalgorithmscalabilityandthesparsityofdataset.Inordertosolvetheseproblem,wedevelopedahybridrecommendationsystemcalledCollaborativeFiltering&User-ClusteringandItem-Clusteringbasedrecommendationsystem.Degreeofdifferencebetweentheuseofratingsdatasparsecollectionofconstructionandproje

7、ctcategoriesdifferencemetricformulafortheuser-Clusterprojectonitemratingmatrixtosolvethecollaborativefilteringalgorithminthefaceofhigh-dimensionaldatasparsenessproblemcharacterizedbypoorrecommended;K-meansclusteringmethodtot

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。