欢迎来到天天文库
浏览记录
ID:35049667
大小:7.00 MB
页数:78页
时间:2019-03-17
《协同过滤系统的数据稀疏性问题研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广东工业大学硕±学位论文(工学硕±)协同过滤系统的数据稀疏性问题研究谢杰民二〇—六年五月:11845分类号:学校代号UDC:密级:学号:2111305007广东工业大学硕±学俭论文(工学硕壬)协同过滤系统的数据稀疏性问题硏究谢杰民指导教师姓名:曾安教授、职称学科(专业)或领域名称:计算化科学与技乂学生所属学院:计賞机学院—六年市月论文答辩日期:二QADissertationSubmitted化GuandonUniversitofggyTechnolofortheDereeofMaster
2、gygMasterofEnineerinScience(gg)ResearchonDataSarsitroblemColpyPinlaborativeFliSiterngystemsCandidate:XieJieminSupervisor:Prof.ZengAnMay2016SchoolofComputerScienceandTechnologyGuangdongUniversityofTechnologyGuangzhou,Guangdong,P.R.China,510006巧要
3、摘要推荐系统是解决信息过载问题的有效方案,已经广泛应用于电子商务、社交网络、音乐社区和电影社区等领域,。近年来协同过滤推荐技术,因其思路简单易实现、数据.一依赖性低、推荐结果准确等优点,已经成为推荐系统领域中应用最为广泛的技术之。协同过滤推荐系统主要分为基于内存的方法和基于模型的方法,但是这些算法都有稀疏性、冷启动和扩展性等问题。本文主要为缓解数据稀疏性问题展开了如下工作:一--(1提种新颖的基于项目候选集的协同过滤算法(CIC巧。CICF)出算法基于用户协同过滤,引入用户之间的非对称影响度和支持度,并考虑到用户对项目的偏好程度,提出了项目候选集
4、的概念,同时利用项目信息烦对未评分项目集合进行二次修正,Mili得到候选项目集合。基于cweLens和netfx数据集的实验表明,相比近云年来多---个比较流行的算法(如:ACPCC算法ICF,RACF算法),C算法在推荐结果的准确率、召回率和F1值上都具有较大的优势,有效地降低了用户评分稀疏性问题带来的负面影,显著提高了推荐系统的推荐质量响。-(2提出了基于好友关系和标签的混合协同过滤算法(FTC。)巧首先分析好友之间的关系网络,通过关系传播机制快速寻找关系网络中与目标用户兴趣爱好相似的用-户,并找到符合目标用户需要的商品;然后,利用TFIDF的思想,从
5、用户历史标签记录中挖掘该用户的兴趣爱好两者有效地结合一;最后将,W进步缓解数据的稀疏性问lastfm数据集的实验表明-CF-题。基于,FT算法比近王年来较流行的算法(如:PRTCF算法和UCTRA算法)在准确率和召回率上都具有较大优势。(3)全面总结了对使用标签信息数据、评分数据和用户/项目属性数据等不同种类数据信息的算法,并详细介绍、实现和实验比较了基于标签和协同过滤的个性化资源推to-N荐、基于近邻双聚类的协同过滤p推荐系统和基于賴合对象相似度的项目推荐算法。基于MovieLenslOM数据集的实验表明,当推荐系统获得用户/项目的信息越多,我<们对
6、用户的了解就越多,就越容易把握用户的兴趣爱好,所1^1将多方面的数据信息进行有效的融合,有助于提高推荐系统的推荐质量。:推荐系统关键词;协同过滤;标签;社交网络;数据稀疏性IABSTRACTABSTRACTAsanefectivesolutiontoinformationoverload,recommendationsystemhasbeenwideusedinelectroniccommerce?socialnetwork,.onlinemuscandoveslyimicommunities,etcB
7、tsasmlementtlot,).ecauseofieyipaion,wdaadeendencandaccuratepyresults,collaborativefilteringrecommendationalorithmhasbecomeoneofthemostgwidelymed1:echnologiesintherecommendationsystem.Collaborativefil
此文档下载收益归作者所有