欢迎来到天天文库
浏览记录
ID:34397768
大小:340.36 KB
页数:4页
时间:2019-03-05
《一种基于云模型数据填充的算法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第2()卷第1期计算机技术与发展Vo1.20No.122()l0年.l2月)~_1PUTERI'ECHN(ⅥYANDDEVEI门PMENTDec.2010一种基于云模型数据填充的算法余志虎,戚玉峰(南京邮电大学计算机学院,江苏南京210003)摘要:协同过滤推荐技术是现如今电子商务系统中最重要的技术之一。针对目前协同过滤推荐技术中存在的因数据极度稀疏而导致相似性度量不准,推荐质量严重受到影响的问题,利用云模型在定性知识表示及定性、定量知识转换时的作用,提出一种基于云模型的数据填充算法,它利用相似用户计算目标用户评分缺失项。利用经典实验数据进行验证比较,结果表明,即使在用
2、户评分数据极端稀疏的情况下,利用此算法对数据进行填充之后,再采用传统的协同过滤推荐算法能取得较理想的推荐质量,从一定程度上解决了推荐系统中普遍存在的稀疏性问题。关键词:云模型;数据稀疏;数据填充中图分类号:TP301.6文献标识码:A文章编号:1673—629X(201O)12—0034—04ADataFillingAlgorithmBasedonCloudModelYUZhi—hu,QIYu—feng(Sch~lofComputer,NanjingUniversityofPosts&Telecommunications,Nanjing210003,China)Abst
3、ract:ThecollaborativefilteringisoneofthemostimportanttechnologiesincurrentE—corunlereesystem,intheviewofdataincol—laborativefilteringtechnologyareextremelysparseresultinginbadsimilarityme~tsureandrecommendpoorquality,usingacloudnxxtel’actioninqualitativeknowledgerepresentationandtheroleo
4、fconversionamongqualitativeandquantita~eknowledge,pr0p0sedadataf;lI—ingalgorithmbasedoncloudmodel,andusingtheclassicalexperim∞taldatatovalidateandcompare,itcalculateuserscoremissingiteco.sbyusingsimilaruser.Theresultshows,eveniftheuser’sratingdataisextremelysp~-se,itcangetbetterrecommend
5、ationqualitybyfilingdatawiththealgorithmandadoptingtraditionalcollaborativefilteringalgorithm.tosomeextentitcsnsolveo)lm啪spathepmb—lemsinrecorfl~endedsystem.Keywords:cloudmodel;datasparse;datafillingO引言或产品的特征来推荐给目标用户或产品的打分数据现今世界信息量随着网络的发展而飞速膨胀,如值,其中最常使用的方法是K近邻(K—NearestNeigh—从电子商务网站获得的产品
6、数据,其数据量增长的如bor,KNN)方法。从这种基于记忆的方法可以看出,算此快以致我们很难处理它,例如:Yahoo、Amazon和法比较简单性,但其推荐效率高,也因此在推荐算法中CDNow等等这些网站每天都提供了大量选择给它的是一种较成功的推荐方法。基于模型的方法则是采用潜在客户如何从中找到最适合用户的需求和爱好的一种预测模型3,这种模型是通过早先从产品评价库产品则成为难点,为了克服这个问题,推荐系统出现并中获得的一个模型,再把这种模型用于对应目标用户变成了研究者的一个研究热点。的推荐中去,目前比较流行的方法包括聚类模型[41、推荐系统中有一个最著名的方法就是协同过S
7、VD[5J等。上面几种常用的推荐方法中,都有一个推滤⋯1,它分为基于记忆和模型两种协同过滤算法,本质荐系统中常见的问题,那就是对冷启动问题没有很好是通过对已有数据通过与其相似性来推荐目标数据评的得到解决,从而会使推荐精确度受很大影响,表现分值,其中,基于记忆协同过滤算法包括基于产品协同为,当一个用户评分数据稀疏时,这很容易找到,如当过滤2和基于用户协同过滤,其思想是通过相似用户当网中图书数据库,一个庞大的产品库,一些冷门书会很难得到用户的评分以及一些新手购书很少有评价值,从而很难从中找到相似的用户,这就导致最后推荐收稿日期:2010—04
此文档下载收益归作者所有