欢迎来到天天文库
浏览记录
ID:37032339
大小:1.84 MB
页数:68页
时间:2019-05-15
《基于分布表示的广告点击率预估算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号学号M201676102学校代码10487密级硕士学位论文基于分布表示的广告点击率预估算法研究学位申请人:王涛学科专业:软件工程指导教师:胡雯蔷副教授答辩日期:2018.12.18AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreefortheMasterofEngineeringResearchontheAdvertisementClick-Through-RatePredictionAlgorithmBasedonDistributedRe
2、presentationCandidate:WangTaoMajor:SoftwareEngineeringSupervisor:Assoc.Prof.HuWenqiangHuazhongUniversityofScience&TechnologyWuhan430074,P.R.ChinaDecember,2018■独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研宄成果。尽我所知,,除文中已经标明引用的内容外本论文不包含任何其他个人或集体己经发表或撰写过的研宄成果。对本文的研究做出
3、贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:王%日期:2〇忾年丨月5日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,g卩:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在年解密后适用本授权书。本论文属于一不保密
4、“”(请在以上方框内打V)学位论文作者签名:指导教师签名:繼日期:15日曰期〇:2丨;I月?年月S日別年|华中科技大学硕士学位论文摘要互联网广告是广告市场的重要组成部分,也是各大互联网公司最重要的盈利手段之一。广告交易平台按照用户点击次数进行计费。在实时竞价策略下,广告交易平台将收益期望最高的广告推送给用户。收益期望的估计依赖于预估点击率。因此如何更加准确地估计广告点击率有着强烈的现实利益需求。点击率预估中的数据常常是高维稀疏样本,而且头部、尾部数据分化明显,因此高维稀疏特征的刻画对模型的性能起着至关重要
5、的作用。但是在已有模型的框架下,常常具有无法利用高维稀疏特征,或者对高维稀疏特征的表达不够充分的问题。因此本文提出并使用了一种基于分布表示的,能够获得高维特征的低维表示的算法来解决这一问题。在自然语言处理中,分布特性是指词的意义的相似程度与它们上下文的相似程度有正相关的联系,所以常常基于分布特性采用非监督学习的方式从大规模语料中学习得到词的含有语义信息的低维分布式表示。通过对数据的分析验证,发现在特定地场景下,点击率预估中的数据样本也具有这种分布特性,其上下文信息同样存在。因此可以通过类似的思路获得高维稀疏特征的低维分布式表示
6、,即特征的隐向量。本文还提出了一种针对分布特性的适用性指标,可以衡量分组上下文的组间差异度和覆盖度。通过适用性指标,可以找到合适的特征组合,基于特征组合可以生成一系列具有意义的上下文。在得到上下文之后,本文使用了一种针对当前任务改进的奇异值分解方法和Skip-gram方法,来进行分布式表示的学习,并获得高维特征的低维隐向量。文本选择了三种较有代表性的模型建模。首先在不使用分布表示的情况下,分别利用了这三种模型进行了训练。随后,本文结合了低维隐向量进行改进后,重新对以上三种模型分别进行训练。通过分析在Kaggle平台的AVAZU
7、数据集上的实验结果,发现在损失函数上有不同程度的降低,可以认为以上方法对高维稀疏特征进行了有效的学习,能够提高广告点击率预估的性能。关键词:在线广告点击率预估分布表示降维I华中科技大学硕士学位论文AbstractOnlineadvertisementisanimportantpartoftheadvertisingmarketandoneofthemostimportantmeansofmakingprofitsformajorInternetcompaniesaswell.Theadexchangeplatformsareb
8、illedbasedonusers’clicks.Withthereal-timebiddingstrategy,theadexchangeplatformspushtheadvertisementwiththehighestexpectedrevenuetousers.Es
此文档下载收益归作者所有