欢迎来到天天文库
浏览记录
ID:33402011
大小:5.93 MB
页数:65页
时间:2019-02-25
《基于分类模型的广告推荐方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、劣撂交硕士学位论文基于分类模型的广告推荐方法研究ResearchonAdRecommendationSystembasedonClassificationAlgorithms作者:李哲导师:王志海北京交通大学2014年3月学位论文版权使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可以将学位论文的全部或部分内容编入有关数据库进行检索,提供阅览服务,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅。同意学校向国家有关部门或机构送交论文的复印件和磁
2、盘。(保密的学位论文在解密后适用本授权说明)学位论文作者签名:李皙导师签名:互圭彭签字日期:如I¥年弓月f8日签字日期:zo脾年3月侈日中图分类号:TPl81UDC:004.8学校代码:100044密级:公开北京交通大学硕士学位论文基于分类模型的广告推荐方法研究ResearchonAdRecommendationSystembasedonClassificationAlgorithms作者姓名:李哲导师姓名:王志海学位类别:工学学科专业:计算机科学与技术学号:11120459职称:教授学位级别:
3、硕士研究方向:数据挖掘北京交通大学2014年3月致谢本论文的工作是在我的导师王志海教授的悉心指导下完成的,王志海教授严谨的治学态度和科学的工作方法给了我极大的帮助和影响。在此衷心感谢三年来王志海老师对我的关心和指导。瞿有利老师对于我的科研工作和论文都提出了许多的宝贵意见,在此表示衷心的感谢。在实验室工作及撰写论文期间,何颖婧、付彬等同学对我论文中的研究工作给予了热情帮助,在此向他们表达我的感激之情。另外也感谢家人,他们的理解和支持使我能够在学校专心完成我的学业。中文摘要伴随着互联网数据爆炸式地增
4、长,用户面对的信息量和种类也越来越多,海量数据挖掘技术在个性化推荐系统中的应用成为了一个研究热点。本文首先总结了常见的几类推荐方法,主要包括协同过滤方法、基于内容的推荐方法和混合推荐方法,以及它们涉及到的数据挖掘技术,并分析了这几类方法的优点与不足。在此基础上,本文从广告推荐问题入手,介绍了计算广告的相关概念和方法,并引出了两种基于内容的广告推荐方法,即单标记分类模型和多标记分类模型。论文的主要工作如下。第一,我们结合Hadoop平台实现了针对某互联网公司提供的广告日志数据的可视化统计与分析工具
5、,利用该工具对数据进行分析并发现了特征之间和广告之间的依赖关系。第二,提出了利用非广告特征和广告特征依赖关系的单标记分类模型的一种改进方法,其利用了互信息来选择组合特征从而加入特征之间的依赖关系。第三,提出了利用广告之间依赖关系的多标记分类模型改进方法,其通过一种启发式的方法来构建分类器链从而更好地利用广告之间的依赖关系。最后,在Hadoop平台上的设计了相关实验,实验结果表明这两种改进方法都能够比改进前的方法得到更好的结果。因此,无论是特征之间还是广告之间的依赖关系,都是广告推荐问题中不可忽视
6、的影响因素。关键词:数据挖掘;推荐系统;多标记分类分类号:TPl81j匕立交垣太堂亟主堂焦论塞△旦墨!B△£!ABSTRACTWiththeexplosivegrowthoftheInternetdata,usersarefacingmoreandmorekindsofinformation,anddataminingtechnologyusedinpersonalizedrecommendationsystemshasbecomearesearchhotspot.Thispapersummar
7、izesseveralkindsofcommonmethodsinrecommendationsystem:collaborativefilteringmethod,content-basedmethod,hybridmethods,anddataminingtechnologiesrelatedtothem.Besides,weanalyzetheadvantagesanddisadvantagesofthesemethods.Then,thispaperfocusesonadrecommen
8、dationproblems,andintroducestwokindsofcontent-basedmethodsinadrecommendation:single.1abelclassificationmodelandmulti—labelclassificationmodel.WedevelopatoolforvisualizationofstatisticsandanalysisofadlogdataprovidedbyoneinternetcompanywiththeHadooppla
此文档下载收益归作者所有