hbase在时间序列数据库中的应用-15页

hbase在时间序列数据库中的应用-15页

ID:5294717

大小:6.40 MB

页数:15页

时间:2017-12-07

hbase在时间序列数据库中的应用-15页_第1页
hbase在时间序列数据库中的应用-15页_第2页
hbase在时间序列数据库中的应用-15页_第3页
hbase在时间序列数据库中的应用-15页_第4页
hbase在时间序列数据库中的应用-15页_第5页
资源描述:

《hbase在时间序列数据库中的应用-15页》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、HBase在时间序列数据库中的应用数据库高级技术专家悠你123时序数据和时序数据库介绍HiTSDB针对时序场景的优化HBase作为底层存储的优势时序数据和时序数据库介绍时序数据就是分布在时间上的一系列数值例子:•股票价格•广告数据•气温变化•网站的PV/UV•健康数据•工业传感器数据•服务器系统监控数据•车联网时序数据和时序数据库介绍一个时序数据的例子时序数据和时序数据库介绍时序数据的特点•数量巨大的数据源•持续产生大量数据•最近的数据最有价值•数据老化•多维度标签•聚合/分析时序数据和时序数据库介绍时序数据vs传统数据库把时序数据按行保存在MySQL的innoDB引擎里,用SQL语句做聚合/

2、分析写入慢查询慢存储成本高Btree结构的索引随机写入性能不佳联合索引只能使用空间优先的方式每行的标签列重复出现时序数据和时序数据库介绍OpenTSDB的HbaseSchema•AsyncHbaseClient•Tag->id•rowkey时间优先•数据按小时打包•热点问题•RowscanHiTSDB针对时序场景的优化HiTSDB的核心技术倒排索引高压缩比缓存分布式聚合引擎解决多维查询的性能问题大幅提升读性能,合并以后写入,提升写性能解决单点聚合的性能问题HiTSDB针对时序场景的优化倒排索引全内存架构metric->tagkey->tagvalue->tsIdset快速交集计算性能评估以及结

3、果缓存持久化到HBaserowKey=metric+tagkey+tagvalue+tsIdbatchwrite,scanread,loadonboottimeshardingkey作为前缀MetaData管理前缀查找提供输入提示提供tsId->(metric,(tagkey,tagvalue))索引作为删除依据HiTSDB针对时序场景的优化高压缩比缓存以写回方式工作的内存缓存时间使用delta->delta压缩,数据使用异或压缩每个数据点平均能压缩到2字节以内可以兼容更多的压缩算法,比如压缩率更高的有损压缩BinLog和HBase分享同一个HDFS单点写入,所有节点可读HBase写回压缩数据

4、写满时间窗口后写回HBase时间窗口边界作为rowkey后缀异步批量写入HiTSDB针对时序场景的优化分布式聚合流式架构数据单向流动,一边读取一边计算,降低latency大部分的简单计算可以分别计算,最后再聚合只保留最低限度的中间结果,降低内存消耗粗略计算针对无法实现分布计算的算法,使用粗略计算来实现算法的分布式HBase作为底层存储的优势HiTSDB的存储需求树形结构的操作key->value有序的快速前缀扫描LSMTree顺序写盘,快速写入临近的rowkey往往具有相邻的存储位置key->value比Btree略慢HBase作为底层存储的优势HiTSDB的进一步需求高可用可以容忍单点服务器

5、故障快速的故障检测/恢复时间线性扩容读/写性能线性扩容磁盘容量线性扩容高可靠多副本低成本分级存储HBase作为底层存储的优势HBase实际上为HiTSDB提供了高写入性能高可用性水平扩展性数据可靠性Key-Value

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。