互联网广告综述之点击率系统

互联网广告综述之点击率系统

ID:12597731

大小:26.50 KB

页数:10页

时间:2018-07-18

互联网广告综述之点击率系统_第1页
互联网广告综述之点击率系统_第2页
互联网广告综述之点击率系统_第3页
互联网广告综述之点击率系统_第4页
互联网广告综述之点击率系统_第5页
资源描述:

《互联网广告综述之点击率系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、互联网广告综述之点击率系统10互联网广告综述之点击率系统10互联网广告综述之点击率系统10声明:1)该博文是整理自网上很大牛和专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。4)阅读本文需要互联网广告业的基础(如果没有也没关系了,没有就看看,当做跟同学们吹牛的本钱)。5)此

2、属于第一版本,若有错误,还需继续修正与增删。还望大家多多指点。请直接回帖,本人来想办法处理。6)本人手上有word版的和pdf版的,有必要的话可以上传到csdn供各位下载一.互联网广告技术博文《互联网广告综述之生态圈》论述过互联网广告生态圈的各个平台,大家可以看到,其中的Adexchange是躺着赚钱的平台,风险并不大。其中的DSP就承担了比较多的风险,如果向Ad10exchange请求的流量太贵,而广告主开价比较低的话,就可能面临亏钱。另外,广告主的需求是变化多样的,有些广告主愿意开一定价钱要求多少次点击,而有些广告主就希望开多少价钱有多少次互动,同时广告主会对效果有所

3、需求。换句话说,评估流量的质量对DSP非常重要。DSP需要评估流量质量,如果发现一个流量的质量很高,就开高价去竟争这个流量;如果流量质量低,就开低价去竟争。如果评估得太高,出很高的价钱拿到了质量很低的流量,那就达不到广告主的要求,会亏钱;如果评估得太低,一直拿不到流量,没办法赚钱。所谓评估流量质量,说到底了是预估一个流量的ctr(点击率,也成为点击某广告的可能性),所以对于DSP来说,能否估准ctr是DSP生存的关键。1.1互联网广告点击率预估做点击率预估需要两方面的数据,一方面是广告的数据,另一方面是用户的数据,对于DSP来说,广告数据它自己有,用户数据可以从DMP获取

4、,它自己的工作是利用这两方面的数据评估用户点击这个广告的可能性(也就是概率)。1.1.110预估方法讨论对点击率的预估,做的工作可以用下面的图来描述。预估一个人点击一个广告的概率,不可能是一个人在那里看着,来一个广告请求就估计一下,给个决定,这样人累死,估计得也乱七八糟,还效率不高,一天撑死了估计个几十万个请求,不得了了。只能用机器来估,但是机器是很笨的,只能进行简单的规则运算,这些规则还必须提前指定。如果人工指定这些规则,如30岁用户点击匹克篮球的广告概率是多少,男性的用户点击匹克篮球的广告的概率是多少,年龄和性别在总的ctr预估里面占多少比重等等,则需要大量的先验知识

5、,而且还不能根据实际情况变化,往往有问题。这就需要机器学习方法来辅助了,一个是统计方法,一个是模型。统计方法怎么用呢?如可以统计过去投放过的记录中,30岁的用户点击匹克篮球的广告的点击率是多少,这个数据直接就能根据投放日志统计出来;再统计男性的用户点击匹克篮球的广告的点击率是多少,这样前面的两个东西就得到了。但是知道这两个点击率,还需要知道这两个点击率在评估这个人点击匹克篮球的广告的概率中分别起什么作用。这两个点击率加起来不行,相减也是不行的,加权累加可能是一种办法,但是这样行吗?为了解决这个事情,需要用模型来解决了。为了描述的方便,我们把这两个点击率称为特征,用一个向量

6、x=(x1,x2)来统一表示,其中x1表示30岁的用户对匹克篮球的广告的点击率,10x2男性的用户对匹克篮球的广告的点击率。利用模型做ctr预估,用数学的方法来描述就是完成上面的图中函数f的形式。本来这个函数的形式是很复杂的,但是太复杂的模型不利于扩展,就用简单的形式来。经过工业界长期的工作,认为下面的形式是比较有效的。其中x是上面的那个x,w也是一个向量,表示的是x的每个特征的权重。这个w每取一个值,对相同的user和ad对就能得到一个预估的ctr,w同时也被称为是模型,因为它能根据x的取值,也就是特征的取值来决定ctr。权重可以人工指定的,但是上面说过了,需要大量的先

7、验知识,而且特征会特别多,如上面还有地域,职业,学校什么的,可以搞到成千上万的特征,人工指定没办法做到周全。所以这个权重的是要用算法来让机器自己学习到的,这个过程称为训练,这个训练过程还不能只根据一个记录user和ad对来训练,要根据很多对来训练。每个展示记录就是一个对,根据历史的一段时间内的展示记录,能有很多的的数据对可以进行训练。用什么方法进行训练呢?上面user和ad对可以达到上亿的量级。10机器学习领域的把这个训练过程称为是拟合分布的过程,他们认为一次广告的展示是否被点击(每次展示被点击的概率可能不一样)是一个伯努利试

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。