欢迎来到天天文库
浏览记录
ID:37027825
大小:3.95 MB
页数:56页
时间:2019-05-15
《基于RF、XGBoost和FFM集成的CTR预估》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:0212.1位代码:10335单1密级:学号:2535068硕士学位论文中文论文题目:基于RF、XGBoost和FFM集成的CTR预估英文论文题目:AResearchonCTRPredictionBasedonIEnsembleofRF,XGBoostandFFM申请人姓名:王雪萍指导教师:王秀云副教授专业名称:统计学研究方向:数据挖掘所在学院:数学科学学院论文提交日期二零一八年三月独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研宄工作及取得的研宄成果
2、。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研宄成果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料一同工作的同志对本研宂所做的任何贡献。与我均已在论文中作了明确的说明并表示谢意。学位论文作者签名签字日期:^月日j学位论文版权使用授权书本学位论文作者完全了解浙江大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。龙人桴叔浙江大犖可以将学位论文的全部或部分内容编入有关数据库进行检索。,可以釆用影印、缩印或扫描等复制手段保存、汇编学位
3、论文(保密的学位论文在解密后适用本授权书)学位论文作者签名导师签名:4:签字曰期:>月曰签字曰期各年j月3曰》学位论文作者毕业后去向:工作单位::电话通讯地址:邮编浙江大学硕士学位论文致谢致谢此时,我即将完成我的毕业论文,即将告别浙里的研究生生涯。在此我心怀感恩,感谢在浙里所遇到的人,所经历的事。就读期间,我的导师王秀云老师对我耐心教导、严格指导,不仅仅在学业上,王老师在生活中也经常关心和照顾我,让我觉得非常温暖。在此,我是真的真的非常感谢王!与此同时老师的照顾,我还要非常我的代成雷师兄,给我讲解了研究背景及实际场景,此
4、由衷地表示感谢!应用知识在代码的实现方面给予了我很大帮助,我在在我求学生活中非常感谢我父母对我学业上的支持们在身后一,我,是他如既往的,!支持,我才能无比坚定的学习进步我感恩他们的付出,我爱他们在浙江大学数学科学学院的两年多的日子里。,我感到非常愉悦的学习氛围数院的老师严谨的教学,踏实做事方式,真诚友善的待人,在学术上孜孜不倦的精神深深地影响了我。各位老师的言传身教让我学到了不断精进的钻研态度,踏实努力的精神,谦虚友善的待人处事。在此,我非常感谢苏中根老师,张,这些都使我未来道路上受益匪浅立新老师,张荣茂老师,张朋老师,赵敏智老师,张奕老师,黄玮老师,武
5、俊德老师,王梦老师等众多老师的传道授业解惑一5。另外,我还要感谢与我同学习的201级统计硕士班的所有同学,以及实验室其他同学,学习生活中给予很多支持的师兄师姐师弟,一感谢让我的学习生活中有许多美好回忆。由衷希望大家在今后工作学习生活中帆风顺。感谢我的室友李冰心同学一起玩耍一起学、陈蒙洁同学,感谢在生活中相互帮助,习。,让我研究生生活充满欢声笑语感谢我亲爱的家人,亲爱的朋友,感澍你们对我学习工作生活的支持和关心。感谢经历的所有一切一,切都是上天最好的安排。最后,衷心地祝福各位师友事业有成,平安顺心。此时,也祝浙江大学数学学院能够蓬勃发展,硕果累累,
6、拥有更美好的明天。1浙江大学硕士学位论文摘要摘要互联网大数据时代,广告投入方和广告展示商会根据广告点击率作出竞拍决策,因此CTR预测的准确性对公司有很高的商业价值。机器学习在预测广告点击率方面起核心作用,CTR预估模型的研究具有实际商业应用价值以及理论研究价值。CTR预估中常用的模型是逻辑回归,但是在广告问题方面,首先数据维度高,数据量非常大,,并且特征之间存在相关信息。以前实际应用中需要快速处理数据并进行特一定能带来好的效果一征选择,很大程度需要依靠人工经验,花费精力的同时不。另方面特征之间存在一些关联信息加有效信息能提高预测的准确性。因
7、此如何快速自,,增动发现有效特征及构建有效特征组合是CTR预估的关键问题。本文在现有常用GBDT构建特征组合并通过LR进行预测的回归模型基础上,将可XGBoost算法代替传统GBDT加入特征之间的相关信息用w.并行化的,并,(%,表示特征二阶交叉信息,即构建了FFM模型,添加到sigmoid函数得到预测概率值。本FFM模型的预一文还研究了集成学习的方式和有效性,将测值作为新特征和已有特征起输入RF模型和XGBoost模型学习,由此建立了XG
此文档下载收益归作者所有