网易视频云hbase最佳实践-列族设计优化

网易视频云hbase最佳实践-列族设计优化

ID:22980494

大小:394.14 KB

页数:10页

时间:2018-11-02

网易视频云hbase最佳实践-列族设计优化_第1页
网易视频云hbase最佳实践-列族设计优化_第2页
网易视频云hbase最佳实践-列族设计优化_第3页
网易视频云hbase最佳实践-列族设计优化_第4页
网易视频云hbase最佳实践-列族设计优化_第5页
资源描述:

《网易视频云hbase最佳实践-列族设计优化》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、网易视频云:HBase最佳实践一列族设计优化网易视频云是网易倾力打造的一•款基于云计算的分布式多媒体处理集群和专业咅视频技术,力客户提供稳定流畅、低时延、高并发的视频直播、录制、存储、转码及点播等音视频的PaaS服务。在线教育、远程医疗、娱乐秀场、在线金融等各行业及企业用户只需经过简单的开发即可打造在线音视频平台。现在,网易视频云与大家分享一下HBase最佳实践一列族设计优化。随着大数据的越來越普及,HBase也变得越来越流行。会用HBase现在已经变的并不困难,然而,怎么把它用的更好却并不简单。那怎么定义‘用的好’呢?很简单,在保证系统稳定

2、性、可用性的基础上能够用最少的系统资源(CPU,IO等)获得最好的性能(吞吐g:,读写延迟)就是’用的好’。HBase是一个庞大的体系,涉及到很多方面,很多因素都会影响到系统性能和系统资源使用率,根据场景对这些配置进行优化会很大程度上提升系统的性能。笔者总结至少有如下儿个方面:HDFS相关配置优化,HBase服务器端优化(GC优化、Compaction优化、硬件配置优化),列族设计优化,客户端优化等,芄中客户端优化在前妞己经通过超时机制、重试机制讲过,后笔者会继续分別介绍其他三个优化重点。本节重点介绍列族设U•优化,HBase中基本属性都是以

3、列族为单位进行设置的,如下示例,用户创建了一张称为‘NewsClickFeedback1的表,表中只有一个列族’Toutiao’,紧接着的属性都是对此列族进行的设置。这些属性基本都会或多或9地影响该表的读写性能,但有些属性用户只需要理解其意义就知道如何设置,而有些属性却需要根据场景、根据业务来设貫,比如BLOCKSIZE属性在不同场景下应该如何设賈?还有COMPRESSION属性和DATA_BLOCK_ENCODING属性,两者都可以提供压缩功能,那到底应该选择哪个,还是两个都需要进行设置?本文就重点介绍这三个属性的设计原则。create•N

4、ew5ClickFeedb«ck{NAME->,ToutiaoV5RSIONS->l,BLOCKCACHE->tPue,BLOO»-1FILTER=>'ROW,,COf-1PRESSION->,SNAPPY*,TTL■>*259200*,DATABLOCKENCOOING■>•PREFIXTREE*,BLOCKSI2E«>,65536,}J{SPLITS«>BlockSize设块大小是HBase的一个重要配置选项,默认块大小为64M。对于不同的业务数据,块大小的合理设置对读写性能有很大的影响。而对块大小的调整,主要取决于两点:1.用户平均

5、读取数据的大小。理论上讲,如果用户平均读取数据的大小较小,建议将块大小设置较小,这样可以使得内存可以缓存更多Wock,读性能自然会更好。相反,建议将块大小设置较大。为了更好说明上述原理,笔者使用YCSB做了一个测试,分别在Get、Scan两种场景下测试不同BlockSize大小(16K,64K,128K)对性能的影响。测试结果分别如下面两图:BlockSize对随机读(Get)性能影响曲线图随着BlockSize的增大,系统随机读的吞吐量不断降低,延迟不断增大。64K大小比16K大小的吞吐量大约降低13%,延迟增大13%。同样的,128K大小

6、比64K大小的吞吐量降低约22%,延迟增大27%。因此,对于以随机读为主的业务,可以适当调低BlockSize的大小,以获得更好的读性能。BlockSize对区间扫描(Scan)性能影响曲线2520151050随着BlockSize增大,scan的苍吐量逐渐增大,延迟不断降低。64K大小BlockSize比16K大小的吞吐量增加了33%,延迟降低了24%;128K大小比64K大小吞吐量增加了7%,延迟降低了7%;因此,对于以scan为主的业务,可以适当增大BlockSize的大小,以获得更好的读性能。可见,如果业务请求以Get请求为主,可以考

7、虑将块大小没置较小;如果以Scan请求为主,可以将块大小调大;默认的64M块大小是在Scan和Get之间収得的一个平衡。2.数据平均键值对规模。可以使用HFile命令查看平均键值对规模,如下:./hbaseorg.apache.hadoop.hbase.io.hfile.HFile-m-f/hbase-sc/data/news/HewsClickFeedback/627bld95153d4157351b65135ab701a3/Toutiao/011b41375e58453ea24a3a203b9cela3Clockindexsizeaspe

8、rheapsize:704reader«/hbase-sc/data/ncws/NewsClickFeedback/627bld95153d4157351b6513

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。