包勇军_京东电商广告和推荐系统的机器学习系统实践

包勇军_京东电商广告和推荐系统的机器学习系统实践

ID:40552977

大小:4.10 MB

页数:38页

时间:2019-08-04

包勇军_京东电商广告和推荐系统的机器学习系统实践_第1页
包勇军_京东电商广告和推荐系统的机器学习系统实践_第2页
包勇军_京东电商广告和推荐系统的机器学习系统实践_第3页
包勇军_京东电商广告和推荐系统的机器学习系统实践_第4页
包勇军_京东电商广告和推荐系统的机器学习系统实践_第5页
资源描述:

《包勇军_京东电商广告和推荐系统的机器学习系统实践》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、包勇军京东京东广告和推荐的机器学习系统实践目录背景介绍浅层模型时代深度学习时代背景介绍

2、我们的业务2 10%&(35 )%(4&/.&( '*-#+"24&$ ,*!背景介绍

3、问题主要解决的问题机器学习在排序算法中的应用特点:实时,在线广告,推荐的混合系统目录背景介绍浅层模型时代深度学习时代浅层模型时代

4、机器学习系统核心问题模型算法日志流训练系统特征系统评估系统浅层模型时代

5、模型算法浅层模型算法:大规模稀疏性特征建模,lr核心优化方向:特征手工特征工程特征组合算法:

6、Fm/ffmgbdt+lr浅层模型时代

7、模型算法Fm/ffm通过因式分解,减少数据稀疏性,有效学习特征组合参数规模:n^2降为k*n(k<

8、特征系统特征系统主要问题:线上线下特征一致性根据经验,线上线下特征一致性的架构,在业务指标上能带来数量级的提升浅层模型时代

9、特征系统架构演化第一版,开始引入机器学习模块,问题产生ApplicationServerPredictor instance  Predictor Mo

10、delinstanceRawLogOfflineFeatureTrainingExtractionSystem浅层模型时代

11、特征系统架构第二版,解决代码不一致,代码复用ApplicationServerPredictor instance  Predictor ModelFeatureExtractionLibraryinstanceRawLog?OfflineFeatureTrainingExtractionSystem浅层模型时代

12、特征系统架构第三版,解决数据不一致,彻底保证正确性ApplicationServerPredictor

13、 instance  Predictor ModelRawLogInstanceLogTrainingSystem浅层模型时代

14、特征系统特征系统架构演变小结特征=数据源+抽取算法第一版是自然的选择机器学习系统是优化阶段的工作,先有日志后有机器学习第二版是策略效率为先的选择策略人员驱动后续的技术升级,离线代码驱动,先有离线代码后有在线代码日志量Double引发的资源担忧特征优化可以回朔历史数据,周期短第三版是保证策略收益的选择在线系统驱动特征升级,牺牲开发效率,保证正确性浅层模型时代

15、模型效果评估评估指标AUCIn

16、verseRatio评估系统的主要问题:各种乌龙,结论不可信旧方案:离线工具评估离线指标新方案:在线系统评估离线指标浅层模型时代

17、模型效果评估在线旁路评估系统将在线predictor作为离线评估的inference工具将在线日志流作为离线评估数据离线测试模型接入在线predictor集群浅层模型时代

18、旁路评估架构图引入在线旁路评估后系统图OnlineEvaluationSystemTraningDataPipelineMetricsMetricsflumekafakastormUIcomputationStorage  Predictor Zoo

19、KeeperProxyrequestroutingPredictorClusterSystempredictor…predictor浅层模型时代

20、在线旁路评估收益数据可比,可信工具到服务平台的升级避免数据diff和工具bug的干扰彻底解决在线实时服务模型中的评估穿越问题浅层模型时代

21、模型效果评估在线实时服务模型中的评估穿越问题Unseendata,历史数据预估新数据数据分布变化更快,泛化性要求更高推荐中的新兴趣点广告中的新广告TimeTime浅层模型时代

22、训练系统浅层模型训练系统的核心问题:大数据的效率问题SamplingDistribut

23、edtraining,libfmonvowpalwabbitIncrementalOnlinelearning:Assumption:stationary->conceptdrift好处:statetrack,时效性问题:系统复杂,需要增加实时计算系统更新频繁,增加了系统耦合特征和算法升级麻烦浅层模型时代

24、多目标优化业务目标:广告收入(year2014)eC

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。