基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf

基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf

ID:50440660

大小:7.46 MB

页数:74页

时间:2020-03-06

基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf_第1页
基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf_第2页
基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf_第3页
基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf_第4页
基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf_第5页
资源描述:

《基于概率图模型的数据密集型广告点击率预测系统设计与实现.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号密级公开编号碛士研究嗲像袷式题目碁于概率图模型的数据密集型广告点击率预測系统设计与实现学院(所、中心)完专业名称计箅机技术研究生姓名刘艺琨学号导师姓名岳昆职称教授年月论文独创性声明及使用授权本论文是作者在导师指导下取得的研宄成果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研究成果,不存在剽窃或抄袭行为。与作者一同工作的同志对本研宄所做的任何贡献均己在论文中作了明确的说明并表示了谢意。现就论文的使用对云南大学授权如下:学校有权保留本论文(含电子版),也可以采用影印、缩印或其他复制手段保存论文;学校有权公布论文的全部或部分内容,可以将论文用于查阅或借阅服务;学

2、校有权向有关机构送交学位论文用于学术规范审查、社会监督或评奖;学校有权将学位论文的全部或部分内容录入有关数据库用于检索服务。内部或保密的论文在解密后应遵循此规定)研宄生签名:导师签名日期:摘要摘要随着、互联网和电子商务的迅猛发展与广泛应用,互联网广告成为了互联网公司最主要的收入模式。广告点击率是评价广告投放成功与否的一个重要标准,成功的广告投放能显著提升互联网公司的收益。而且,对广告的点击率进行准确的预测有利于提升用户的体验。在线用户之间都存在着浏览和搜索等行为上的相似性,这种相似性本身具有不确定性。然而,贝叶斯网作为一种重要的概率图模型,是进行不确定知识表示和推理的重要工具。因此,针对没有

3、浏览或点击历史记录的用户对潜在广告的点击率预测问题,我们利用贝叶斯网的不确定表示和推理方法对用户之间存在的依赖关系进行建模计算,最终预测目标用户对广告的点击率。本文利用平台和编程模型,以贝叶斯网作为支撑理论,从海量的用户浏览和搜索广告的历史数据出发,设计并实现了数据密集型的广告点击率预测分布式并行算法,包括数据预处理、贝叶斯网构建和基于贝叶斯网推理的广告点击率预测算法,具体如下:基于的海量的用户广告搜索历史日志处理。我们将海量的用户搜索广告历史数据存入分布式文件系统中,设计算法读取海量的用户搜索广告历史数据,提取搜索关键词作为用户特征,存入分布式数据库中,为后续的贝叶斯网有向无环图结构的构建

4、做好了准备。基于的贝叶斯网构建。通过并行读取、处理中的数据,高效地构建了贝叶斯网的有向无环图结构,再利用分布式框架并行处理中的数据,计算贝叶斯网中各个节点的条件概率表,均存入。基于贝叶斯网推理的广告点击率预测。利用分布式框架快速、高效地计算出相似用户集合,并利用用户间的相似性进行广告点击率的预测。本文以上述三方面的研宄工作为核心,实现了基于平台的数据密集型广告点击率预测系统,可以使搜索引擎简单地通过调用系统的接口函数得到目标用户对广告点击率的预测结果。关键词:计算广告;点击率预测;用户相似性;贝叶斯网;数据密集型计算AbstractAbstractWiththerapiddevelopmen

5、tandwidespreadusageofWeb2.0,Abstractefficientlybyusingdistributedframework.Then,systempredictsClick-throughRateviausingsimilaritiesbetweenusers.Finally,wedeveloptheadvertisingClick-throughRatepredictingsystemwhichbasedonHadoopplatformcanprocessthemassivedatabasedonabovealgorithm.Thesearchenginecoul

6、dgettheClick-throughRateofthetargetuserbysimpleinvoketheinterfacewhichprovidedbyAdvertisingClick-throughRatePredictingSystem.Keywords:ComputationalAdvertising;Click-throughRatePrediction;UserSimilarity;BayesianNetwork;Data-intensiveComputing目录目录觀第章前言研宄背景及意义研宄现状预测的研宄现状数据密集型计算的研究现状本文的主要研宄内容论文结构第章背景知识

7、简介简介简介简介贝叶斯网概率论基础知识贝叶斯网推理本章小结第章系统架构及算法设计整体架构数据预处理模块海量数据处理与数据存储贝叶斯网构建贝叶斯网构建条件概率表计算广告点击率预测联合概率分布表计算云南大学硕士学位论文得到相似用户集合广告点击率预测本章小结第章实验及分析实验数据和实验环境实验数据设置实验环境设置系统的正确性验证系统的有效性验证系统的执行时间系统的加速比与并行效率实验结果分析第章原型系统设计实现系统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。