欢迎来到天天文库
浏览记录
ID:52439782
大小:772.71 KB
页数:28页
时间:2020-03-27
《江申-DSP基础算法与模型研究-江申-11.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、DSP基础模型与算法研究江申@ 力美移动广告April 20th, 2013PartI:M6DDSP工作的整体流程PartII:M6DDSP核心算法•AudienceSelectionModel•BiddingAlgorithm•EvaluationPartIII:延伸讨论•Bidding中的转化率模型•点击率转化率建模Part I : M6D DSP工作的整体流程1.追踪用户行为(BehaviorTracking)ActionData(Label数据)DSP公司在广告主的网站上埋点(通常是放上一个1x1的不可见像素),这样当互
2、联网用户第一次访问广告主的网站时,就会得到DSP公司的一个cookie。MappingData(特征数据):DSP公司还会和第三方的网站合作(例如:新浪,腾讯),在他们的网站上也埋点,或者向DMP购买网民行为数据,这样就可以追踪到网民在这些网站上的行为。Page 42.受众选择(AudienceSelection)(1)建立AudienceSelectionModel预估用户转化概率P(cu)(2)根据每个用户的P(cu)将用户划分到不同的SegmentsPage 53.通知AdExchangeDSP将Segments中的目标用
3、户的cookie告诉AdExchange,这样AdExchange有这些cookie的展现机会时,才会来向DSP的服务器发送竞价请求。Page 64.Segment管理(1)账户管理员根据每个campaign所属的行业特点,消费能力,决定开启哪些segments,关掉哪些segments。例如:对消费能力有限的小公司的campaign,那些用户转化概率小一些的segments就不开了。(2)账户管理员根据每个segment的平均预估转化概率,结合历史投放经验,为每个Segment设定一个基础出价(BasePrice)。Page
4、75.进行实时竞价(Bidding)(1)当AdExchange把请求发过来的时候,DSP会拿到以下信息:a.当前广告位的信息b.当前用户的cookie和基本信息(ifany)。(2)DSP需要在100ms内,根据对当前用户的理解,并且考虑当前广告位,根据自己的bidding算法,来决定:a.是否要对这次展现机会进行竞价?b.投放哪个campaign的广告?c.出价是多少?Page 86.展现广告如果Bidding最高,赢得了展现机会,则DSP返回创意,用户就会在该广告位看到该创意。7.追踪转化DSP根据在广告主的网站上埋点获得
5、的数据,就能追踪用户是否在这次展现之后进行了转化。根据这些数据统计点击率CTR,转化率CVR,每个转化平均成本CPA等指标,汇总成报表展示给广告主。Page 9Part II : M6D DSP核心算法•Audience Selec5on Model •Bidding Algorithm •Evalua5on M6D DSP核心算法 1.AudienceSelectionModel预估目标:对每个Campaign,预估每个用户的转化概率P(cu)模型特点:(1)Offline模型(2)每一个Campaign训练一个模型,原因:•
6、广告主的Privacy•模型效果Page11M6D DSP核心算法 1.AudienceSelection算法结构两级模型:a.Low-levelModelb.High-levelModelPage12M6D DSP核心算法 <1>Low-levelModelLabel:(数据来自ActionData)所有在该campaign对应的广告主网站上发生转化行为的用户作为正例,其他的用户作为负例。特征:(数据来自MappingData)只有一类特征,即用户访问过的历史URL。特征选择:去掉那些覆盖用户的转化总数小于某个固定的转化数阈值
7、(比如5)的特征(具体做的时候可以用展现数过滤,阈值设为转化数阈值/平均转化率)模型:线性模型Page13M6D DSP核心算法 <2>High-levelModelLabel:同Low-levelModel特征:可以是各种特征a.可解释的用户属性特征,例如:兴趣标签,访问过的URLb.不可解释的用户属性特征,例如:聚类id,Topicidc.与广告主网站的关联特征,例如:重定向标记d.Low-levelModel的输出值模型:基于线性模型,用非线性模型修正Page14M6D DSP核心算法 为何使用两级模型?主要是性能考虑:1
8、.Low-levelModel的特征抽取逻辑简单,模型简单,需要对海量的样本做预测(粗选)。High-levelModel的特征抽取逻辑复杂,模型稍复杂,适合对通过“海选”的较少量样本做预测(精选)。2.Low-levelModel的特征只有用户访问过的URL,
此文档下载收益归作者所有