欢迎来到天天文库
浏览记录
ID:35061317
大小:2.50 MB
页数:54页
时间:2019-03-17
《基于关联分析的用户兴趣漂移挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、硕士学位论文基于关联分析的用户兴趣漂移挖掘算法研究研究生姓名:王夏阳导师姓名:张宇翔副教授2016年4月24日分类号:TP309密级:公开UDC:004.9学号:1305013中国民航大学硕士学位论文基于关联分析的用户兴趣漂移挖掘算法研究研究生姓名:王夏阳导师姓名:张宇翔副教授申请学位类别:工学硕士学科专业名称:计算机科学与技术所在院系:计算机科学与技术学院论文答辩日期:2016年4月24日StudyonUserInterestDriftMiningAlgorithmBasedonAssociationAnalysisADissertationSubmittedto
2、CivilAviationUniversityofChinaFortheAcademicDegreeofMasterofScienceBYWangXia-yangSupervisedbyProf.ZhangYu-xiangCollegeofComputerScienceandTechnologyCivilAviationUniversityofChinaApril2016中国民航大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成,论文果。W标注和致谢的地方外中不包含其他人已经发表尽我所知,除了文中特别加或撰写过
3、的研究成果,也不包含为获得中国民航大学或其它教育机构的学位或证书而使一用过的材料。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。不矣I备.I各研究生签名:主遺日中国民航大学学位论文使用授权声明、中国民航大学、中国科学技术信息研究所国家图书馆有权保留本人所送交学位论。W采用影印、本人电子文档文的复印件和电子文档,可缩印或其他复制手段保存论文一,的内容和纸质论文的内容相致。除在保密期内的保密论文外,允许论文被查阅和借阅可W公布。论文的公布(包括刊登)授权中国民航(包括刊登)论文的全部或部分内容大学研究生
4、部办理。砂^厶导师签名化曰期:7研究生签名::抑弓中国民航大学硕士学位论文摘要随着“大数据”时代的到来,人们被淹没在海量的数据中难以找到真正需求的信息,推荐系统能利用用户的历史消费记录挖掘用户的潜在兴趣进而向其推送有用的信息或商品,成为当下缓解“数据过载”的有效方法。但是传统推荐方法普遍存在三个问题:1、“数据稀疏性”问题:一个真实的网站中用户消费历史往往较少,难以准确体现出用户的真实兴趣;2、用户兴趣变化难以捕获:用户的兴趣会随着消费上下文环境的变化而变化,传统推荐算法都基于用户兴趣稳定的假设,无法准确获取用户的此种兴趣变化;3、推荐“过拟合”问题:推荐系
5、统往往倾向于推荐类似的商品给用户。本文旨在解决上述推荐系统普遍存在的三个问题,做了以下方面的研究。第一,针对“数据稀疏性”问题,建立基于用户关联的数据填充模型。首先,利用评分信息挖掘用户之间相同的偏好并建立关联用户组;其次,根据关联用户组占有度和关联度筛选出强用户关联组;最后,对用户的消费历史进行等时间划分,利用强用户关联组完成对数据稀疏的时间段的填充。第二,针对用户兴趣变化难以捕获的问题,建立用户兴趣漂移模型。首先,利用LatentDirichletAllocation(LDA)对用户的每一段时间内的消费历史进行概率主题抽取;其次,结合时间衰减函数建立用户兴趣漂移
6、模型;最后,预测用户下阶段可能的兴趣并进行项目推荐。第三,针对推荐结果“过拟合”问题,建立用户兴趣扩展模型。首先,建立用户之间的时序关联图,利用随机游走算法挖掘用户之间的相互影响关系,获得对目标用户影响最大的近邻集合;其次,利用同样方法挖掘项目之间的相互影响关系;最后,结合基于用户的协同过滤算法和项目影响权重进行项目推荐。实验表明:为解决上述三个问题,本文提出的算法能够更好更好发现用户的潜在兴趣,推荐给用户真正需要的信息和商品。关键词:数据稀疏;兴趣漂移;关联分析;主题模型;随机游走I中国民航大学硕士学位论文AbstractIntheadventof"bigdata
7、",peoplehavebeensubmergedinthemessofdataandcan’tfindtherealdemandinginformation.Recommendersystemminespeople’spotentialneedsfrommassiveconsumptionhistorybecomeaneffectivewaytoalleviate"dataoverload”.Butthetraditionalrecommendersystemhasthreecommonproblems:thefirstoneisthedatasparsity
此文档下载收益归作者所有