欢迎来到天天文库
浏览记录
ID:39356098
大小:932.10 KB
页数:35页
时间:2019-07-01
《《hbase基础知识》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、课程安排HBASE基础知识*HBASE的全分布的搭建*HBASEShell***HBASE的批量导入***HBASE的Java客户端***---------------------------加深拓展----------------------HBASE的集群的搭建*HBASE的表设计*HBASE的底层存储模型*HBASE基础知识HBase简介HBase–HadoopDatabase,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCServer上搭建起大规模结构化存储集群。HBase利用HadoopHDFS作为其文
2、件存储系统,利用HadoopMapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具。HBASEClustermemberHBASE基础知识HBASE中的每一张表,就是所谓的BigTable。稀疏表。RowKey和ColumnKey是二进制值byte[],按字典顺序排序;Timestamp是一个64位整数;value是一个未解释的字节数组byte[]。表中的不同行可以拥有不同数量的成员。即支持“动态模式“模型逻辑数据模型物理数据模型将逻辑模型中的一个Row分割为根据Columnfamily存储的物理模型数据模型-行RowKey
3、TimeStampColumnContentsColumnAnchorColumn“mime”cnnsi.commy.look.ca“com.cnn.www”T9CNNT8CNN.COMT6“..“Text/htmlT5“..“t3“..“行键列列字符串、整数、二进制串甚至串行化的结构都可以作为行键表按照行键的“逐字节排序”顺序对行进行有序化处理表内数据非常‘稀疏’,不同的行的列的数完全目可以大不相同可以只对一行上“锁”对行的写操作是始终是“原子”的数据模型-列列必须用‘族’(family)来定义任意一列有如下形式“
4、族:标签”其中,族和标签都可为任意形式的串物理上将同“族”数据存储在一起数据可通过时间戳区分版本RowKeyTimeStampColumnContentsColumnAnchorColumn“mime”cnnsi.commy.look.ca“com.cnn.www”T9CNNT8CNN.COMT6“..“Text/htmlT5“..“t3“..“族标签HBASE基础知识表是存放数据的。表由行和列组成数据模型RowKey:行键,Table的主键,Table中的记录按照RowKey排序Timestamp:时间戳,每次数据
5、操作对应的时间戳,可以看作是数据的versionnumberColumnFamily:列簇,Table在水平方向有一个或者多个ColumnFamily组成,一个ColumnFamily中可以有任意多个Column组成,即ColumnFamily支持动态扩展,无需预先定义Column的数量以及类型,所有Column均以二进制格式存储,用户需要自行进行类型转换。HBASE基础知识物理存储Table在行的方向上分割为多个HRegion,一个region由[startkey,endkey)表示,每个HRegion分散在不同的RegionServer中参数hba
6、se.hregion.max.filesizeHBASE基础知识架构体系Client包含访问hbase的接口,client维护着一些cache来加快对hbase的访问,比如regione的位置信息Zookeeper保证任何时候,集群中只有一个runningmaster存贮所有Region的寻址入口实时监控RegionServer的状态,将Regionserver的上线和下线信息,实时通知给Master存储Hbase的schema,包括有哪些table,每个table有哪些columnfamilyMaster可以启动多个HMaster,通过Zookeep
7、er的MasterElection机制保证总有一个Master运行为Regionserver分配region负责regionserver的负载均衡,调整Region分布管理用户对table的CRUD操作在regionserver停机后负责失效的regionserver上的region迁移HBASE基础知识HBASE基础知识架构体系RegionServer维护Master分配给它的region,处理对这些region的IO请求负责切分在运行过程中变得过大的region可以看出,client访问hbase上数据的过程并不需要master参与,寻址访问zoo
8、keeper和regionserver,数据读写访问regioneserver。HRegion
此文档下载收益归作者所有