搭建大规模高性能的时间序列大数据平台

搭建大规模高性能的时间序列大数据平台

ID:21210588

大小:4.21 MB

页数:32页

时间:2018-10-18

搭建大规模高性能的时间序列大数据平台_第1页
搭建大规模高性能的时间序列大数据平台_第2页
搭建大规模高性能的时间序列大数据平台_第3页
搭建大规模高性能的时间序列大数据平台_第4页
搭建大规模高性能的时间序列大数据平台_第5页
资源描述:

《搭建大规模高性能的时间序列大数据平台》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、搭建基于时序数据的大型监测系统FacebookEngineeringManager运维里的监测基于时序数据的监控和警报检测隔离查障修复实时监测系统三个挑战和应对监测系统的基本架构智能监测典型监测系统规模~1persecond三万台虚拟机几百万台服务器每秒搜集三百万个数据点每秒搜集20亿个数据点每秒搜集15亿个数据点存储一个亿的时序数列存储超两百亿的时序数列实时监控五千个告警实时监控一百万个告警六个工程师十二个工程师id⇨(时间1,测量值1),(时间2,测量值2),(时间3,测量值3),…用于监测目的的时序数列(time-series)id可以有不同的定义(Pin

2、terest)数列名字+多个(key,value)对E.g.,cpu.usage{host=foo}(Facebook)entity+keyE.g.,{entity=host1,key=cpu.usage}每一个独特的key/value(或entity/key)组合对应了一个时序数列时序数列的定义典型的基于时序系列的监测系统架构消息总线(message-bus)数据的实时整合和采样告警系统数据可视化和查询虚拟机服务器代理(agent)虚拟机服务器代理(agent)虚拟机服务器代理(agent)时序数据库(TSDB)典型的监测系统三个挑战和应对智能监测三个挑战海量

3、的测量数据需要高吞吐量和大容量的存储方案系统可靠性要高读数据要快必须能模糊搜索可伸缩性和可靠性使用者对监测系统的滥用成本Pinterest的分片分级存储TSDB(最近2小时)TSDB(无限期)WWW服务器和API服务器产生的数据Java服务产生的数据互为备份TSDB(最近2小时)TSDB(无限期)互为备份数据可视化和查询Router(根据各TSDB集群反馈的指标选择最佳集群)当前负载查询成功率查询延迟Facebook的分层存储数据的写入内存TSDB(最近26小时)FlashTSDB(最近14天)Thrift+Hbase(无限期)Hbase周期性任务加大旧数据的时

4、间间隔压缩掉不常用的维度内存时序数据库(in-memoryTSDB)Gorilla是Facebook开源的内存TSDB利用时序数据的冗余做到12倍的压缩率数据的查询响应时间从几秒降低到~0.1秒文章发表于VLDB2015。Github上的开源代号为Beringei多个公司(如Twitter,Pinterest)基于Gorilla的思想,独立开发了自己的内存TSDB数据的预聚合(pre-aggregation)(时间1,测量值1),(时间2,测量值2),(时间3,测量值3),…服务器1(时间1,测量值1),(时间2,测量值2),(时间3,测量值3),…服务器2(时

5、间1,测量值1),(时间2,测量值2),(时间3,测量值3),…服务器3集群预聚合集群(时间1,最大测量值1),(时间2,最大测量值2),(时间3,最大测量值3),…集群(时间1,最小测量值1),(时间2,最小测量值2),(时间3,最小测量值3),…集群(时间1,平均测量值1),(时间2,平均测量值2),(时间3,平均测量值3),…预聚合把高维度的时序数据压缩成低维度,同时保留统计意义。减少存储压力并加快查询速度数据的预聚合-Facebook版本按集群或服务的预聚合按数据中心的预聚合数据的预聚合–Pinterest版本实时计算存储存储用户界面和API数据来源聚合

6、的时序数据库原始的时序数据库Kafka学习预聚合规则评估预聚合规则的效率预聚合规则我学习到如下规则:没有人查询集群A里的单机CPU利用率,所以可以只保留集群A的总体CPU利用率关于集群A的总体CPU利用率,必须计算最大和平均值有人查询了集群B里的单机CPU利用率,所以不能对集群B做聚合用户查询数据的日志7月1号15:30,查询集群A的最大单机CPU利用率7月1号17:00,查询集群A的平均单机CPU利用率7月1号18:00,列出集群B的所有单机CPU利用率7月1号18:10,查询集群B的最小单机CPU利用率……Kafka原始时序数据的写入预聚合规则学习器实时数据

7、的聚合时序数据库规则三个时序数列被聚合成三个,压缩比为1预聚合规则的效率(时间1,测量值1),(时间2,测量值2),(时间3,测量值3),…服务器1(时间1,测量值1),(时间2,测量值2),(时间3,测量值3),…服务器2(时间1,测量值1),(时间2,测量值2),(时间3,测量值3),…服务器3集群预聚合集群(时间1,最大测量值1),(时间2,最大测量值2),(时间3,最大测量值3),…集群(时间1,最小测量值1),(时间2,最小测量值2),(时间3,最小测量值3),…集群(时间1,平均测量值1),(时间2,平均测量值2),(时间3,平均测量值3),…只有压

8、缩比大于1的聚合规则才有

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。