HBase在阿里的应用与优化.pdf

HBase在阿里的应用与优化.pdf

ID:48022259

大小:827.41 KB

页数:25页

时间:2020-01-27

HBase在阿里的应用与优化.pdf_第1页
HBase在阿里的应用与优化.pdf_第2页
HBase在阿里的应用与优化.pdf_第3页
HBase在阿里的应用与优化.pdf_第4页
HBase在阿里的应用与优化.pdf_第5页
资源描述:

《HBase在阿里的应用与优化.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、HBase在阿里的应用与优化邓明鉴2012.7.1Agenda•HBase介绍•HBase在阿里的发展•遇到的问题及优化•未来的工作•Q&AHBase介绍•HBase是什么–HBaseistheHadoopdatabase.Thinkofitasadistributed,scalable,bigdatastore.HBase介绍•HBase的特点•支持海量数据•拥有良好扩展性•高性能读写•快速分析•满足强一致性要求•schema灵活多变•列存储•良好易用的JAVA接口HBase在阿里的发展•2011.3月开始研究•2011.5月上线第一

2、个应用•截止2012.1,线上部署:–2个机房–150台服务器–应用约12个(核心应用2个)–总tps约100k/s–总数据量约60TBHBase在阿里的发展•截止2012.1–线上只部署有0.90.2RC3的版本HBase在阿里的发展•接下来…–应用持续增加–数据量成倍增长–tps成倍增长–应用类型及要求更加复杂–应用方对服务稳定性要求增加–应用方对响应时间要求增加–应用方对服务透明性要求增加遇到的问题及优化•数据量增大–对写无影响–影响compact–影响gc–影响读性能–网络带宽–region数量上升?HFileV2遇到的问题及

3、优化•稳定性要求提高–随意宕机–multiassign–慢响应–hang遇到的问题及优化•内存增大,gc问题突出–YGC占用时间长•Eden大小控制在2GB以内–FULLGC会导致节点crash•使用CMS•mslab谨慎使用–频繁cms导致load升高•合理的CMSInitiatingOccupancyFraction•合理的SurvivorRatio遇到的问题及优化•毛刺与慢请求–compact算法–多线程compact–读写分离–java.lang.Class.getMethod遇到的问题及优化•HDFS实时性问题–blockre

4、portcdh3u3解决–datanode参数•dfs.socket.timeout•dfs.datanode.socket.write.timeout•dfs.datanode.failed.volumes.tolerated•dfs.client.cached.conn.retry•dfs.datanode.max.xcievers–调度算法,如FSNamesystem.commitBlockSynchronization遇到的问题及优化•性能优化–0.94为什么可以极大提高性能?•groupsync•及时清理cache•改进的c

5、ompact算法•lazy-seek•HLogCompress•前缀压缩遇到的问题及优化•0.94版本的优势与劣势•优势–性能明显提升–测试框架加快–节省占用空间•劣势–不稳定,BUG较多遇到的问题及优化•宕机恢复时间要求短–之前的状况:100kregion的集群大约需要15-30分钟才能完全恢复读写遇到的问题及优化–修改脚本,crash即时感知–跳过不必要的hlog–扫描meta带上cache–批量操作,减少rpc–优化zk操作中锁竞争–tcpnodelay–bulkassign–zk串行改并行–hdfs创建元数据操作并行遇到的问题及

6、优化•宕机恢复时间缩短–现状(单台servercrash):15-30分钟–优化为:小于1分钟•ddl恢复时间缩短–现状(集群重启):数小时–优化为:数分钟遇到的问题及优化•更加完善的监控遇到的问题及优化遇到的问题及优化遇到的问题及优化•经过以上工作,目前的系统:–覆盖4个机房–服务器扩展到500+–总数据量约400TB–总tps超过300k/s–应用增加到30多个–核心应用达到6个–0.90/0.92/0.94版本都有线上应用遇到的问题及优化•目前线上系统–2月起每月会release1-2个版本–0.90系列:8个版本,灰度发布(服务

7、器占比87%)–0.92系列:1个版本(服务器占比10%)–0.94系列:1个版本(服务器占比3%)遇到的问题及优化•与社区的互动–直接提交patch:约30–间接提交patch:接近20–占比:0.90.4以来的patch占比2.5%左右–critical以上级别:8–apacheid:chunhuishen/xingshi/binlijin•对HBase的在线应用更加有信心未来的工作•二级索引•snapshot及replication•引入独立cache策略,适用于不同场合•实时化HDFS版本•NameNodeHA•全面运维自动化•

8、HiveinHBase优化•资源隔离•安全与权限•更深入的性能优化Q&A

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。