通用广告引擎的索引设计和性能优化教学教案.ppt

通用广告引擎的索引设计和性能优化教学教案.ppt

ID:52143369

大小:777.50 KB

页数:36页

时间:2020-04-01

通用广告引擎的索引设计和性能优化教学教案.ppt_第1页
通用广告引擎的索引设计和性能优化教学教案.ppt_第2页
通用广告引擎的索引设计和性能优化教学教案.ppt_第3页
通用广告引擎的索引设计和性能优化教学教案.ppt_第4页
通用广告引擎的索引设计和性能优化教学教案.ppt_第5页
资源描述:

《通用广告引擎的索引设计和性能优化教学教案.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、通用广告引擎的索引设计和性能优化阿里妈妈事业部师陀Agenda背景索引设计和实现遇到的问题下一步工作性能优化过程性能优化小结Q&A背景广告引擎的基本状况层级结构:广告主->广告计划->广告商品->竞价词背景广告引擎的基本状况层级结构:广告主->广告计划->广告商品->竞价词广告查询流程Query解析->倒排查询->过滤->算分->排序->拼装结果返回背景广告引擎的基本状况层级结构:广告主->广告计划->广告商品->竞价词在线查询流程Query解析->倒排查询->过滤->算分->排序->拼装结果返回索引数据:每天重建全量+实时更新增量背景广告引擎的基本状况层级结构:广告主->广告计划-

2、>广告商品->竞价词在线查询流程Query解析->倒排查询->过滤->算分->排序->拼装结果返回索引数据:每天重建全量+实时更新增量多条产品线,引擎技术有通用性背景一年前:使用搜索引擎isearch的索引内核+自己开发的辅表结构相对实现复杂,正排读接口不清晰性能问题背景一年前:使用搜索引擎isearch的索引内核+自己开发的辅表结构相对实现复杂,正排读接口不清晰性能问题重构:新的通用广告引擎(一期)索引支持主辅表结构只做广告引擎需要的功能目标:性能和可维护性索引设计倒排:全量+增量Payload字段可配置增量的多级可回收内存池索引设计正排:主/辅表结构多种值类型:bit/int8/

3、int16/…/float/string多种字段类型:单值/固定多值/变长多值定长字段和变长字段的紧密存储Package表的关联字段平铺索引设计正排:主/辅表结构多种值类型:bit/int8/int16/…/float/string多种字段类型:单值/固定多值/变长多值Package表的关联字段平铺索引设计正排多种值类型:bit/int8/int16/…/float/string多种字段类型:单值/固定多值/变长多值定长字段和变长字段的紧密存储Package表的关联字段平铺主/辅表+keyId->docId的hash表+DeleteMap索引实现索引实现索引实现索引实现索引实现其他T

4、ableWriter的其他成员DeleteMapKeyIdHashTable相关小工具:indexLibPrinter遇到的问题(1)Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性遇到的问题(1)Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控遇到的问题(1)Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方案@2.6.18内核:flush_mmap_pages=0遇到的问题(1)Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方

5、案@2.6.18内核:flush_mmap_pages=0Pagecache换入换出不可控遇到的问题(1)Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方案@2.6.18内核:flush_mmap_pages=0Pagecache换入换出不可控mlock:不符合极端情况的异常处理需求遇到的问题(1)Mmap的得失天然的弱持久化方案利用系统pagecache管理数据局部性脏页回写不可控短期解决方案@2.6.18内核:flush_mmap_pages=0Pagecache换入换出不可控mlock:不符合极端情况的异常处理需求另外的解决方案:

6、使用shm替换mmap,主动控制持久化和故障恢复遇到的问题(2)稳定性每天build全量的过程牵涉的系统太多太复杂故障恢复的能力需要加强解决方案:索引重整+索引压缩遇到的问题(2)稳定性每天build全量的过程牵涉的系统太多太复杂故障恢复的能力需要加强解决方案:索引重整能力+索引压缩数据灵活性跟分布式build的结合批量更新能力下一步工作广告引擎设计时的各项指标优先级稳定性正确性灵活性问题定位能力性能下一步工作一期的新引擎还是很像搜索引擎dispatchersearchNodesearchNodesearchNodemerger下一步工作dispatchersearchNodesea

7、rchNodesearchNodemerger分布式引擎索引数据中心服务化的searchNode集群期望的广告引擎性能优化目标:searchNode的单机qps优化,主要是cpu优化方法:Perf热点分析代码优化业务层优化索引数据层优化Cpu资源利用最大化性能优化过程全量qps全量rt增量qps增量rtBASE71526msstrncpymemcpy109117ms增加结果初选178011msPartial_sort优化182311ms增加进程个数351

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。