欢迎来到天天文库
浏览记录
ID:20821723
大小:3.45 MB
页数:77页
时间:2018-10-16
《4 维度建模方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据仓库中的元数据元数据:关于数据的数据;描述数据结构、内容、码、索引等信息。元数据的重要性元数据的内容元数据的重要性管理人员做分析时,往往先从元数据入手。例如:从元数据中查广义索引,再进一步搜索支持数据转换:DB环境的数据DW环境的数据元数据描述“转换”;元数据本身具有良好的灵活性,适应变化。例如:不同时期,数据结构是变化的支持对数据仓库中数据的理解例如:结构、粒度层次、分片策略、索引等元数据的分类技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库是用的数据。包括:数据源信息;数据转换的描述;数据仓库内
2、对象和数据结构的定义;数据清理和数据更新时用的规则;源数据到目的数据的映射;用户访问权限,数据备份历史记录,数据导入历史记录,信息发布历史记录等。商业元数据从商业业务的角度描述了数据仓库中的数据。包括:业务主题的描述,包含的数据、查询、报表;[业务的关注点,比如销售量,客户购买情况]维度建模方法维度建模维度建模的相关概念维度建模的基本步骤多维数据模型直观的表示现实中的复杂关系基本组成维度量(变量、指标)立方体Example:计算每一个商场,每一产品销售额产品、商场交叉表联机分析(OLAP)维度模型多维数据模型的组成维
3、(Dimension)维层次路径、维层次、维成员(维实例)、维层次属性事实(Fact)度量(Measure)数据立方体(Cube)维维:对数据进行分类的一种结构,以用于从特定的角度观察数据。(例如:时间、地区、产品)维的两个用途选择针对期望详细程度的层次的数据分组对细节数据综合(聚集)到相应的详细程度的数据层次维维的组织方式:维层次路径(HIERARCHY)维层次路径由代表不同详细程度的维层次(Level)组成。维的层次:特定角度的不同细节程度维层级层级是维度属性组内属性之间的两级或多级结构。高一级的属性(组)构成的
4、维度完全包含低一级的一个或多个属性(组)构成的维度。CountryStateCountyCity事实(度量)度量(指标):数据的实际意义,一般是一个数值度量指标例如:销售量、销售额,……而具体数据(如“10000”)是变量的一个值事实:存储一个多维数据表达期望分析的主题(目的、感兴趣的事情、事件或者指标等)具有一定的粒度,粒度的大小与维层次相关一个事实中通常包含一个或者多个度量一个度量的两个组件数字型指标聚集函数立方体(CUBE)按照一定维层次结构和度量(事实)的逻辑上的组织其逻辑上相当于一个多维数组多维数组多维数组
5、:一个多维数组表示为:(维1,维2,...,维n,变量)例如:(时间、地区、销售渠道、销售额)可扩展维数:如(时间、地区、销售渠道、商品类型、销售额)数据单元(Cell)数据单元(单元格):多维数组的取值可表示为:(维1维成员,维2维成员,...,维n维成员,变量的值)例如:(1997年1月,北京,批发,10000)多维分析多维的切片(slice)从多维数组选定一个二维子集,切出一个“平面”多维的切块(dice)从多维数组选定一个三维子集,切出一个“立方体”切片切片和切块多维分析2002年2003年1季度2季度3季度
6、4季度1季度2季度3季度4季度北京市123564566134562355上海市13410398871021399782天津市6773599673696294旋转改变一个报告(或页面)显示的维方向旋转北京市上海市天津市2002年1季度123134672季度56103733季度4598594季度6687962003年1季度134102732季度56139693季度2397624季度558294钻取根据维层次,改变数据的粒度“上卷”(roll_up)是指沿某一个维的概念分层向上归约;“下钻”(drill_down)是上卷的
7、逆向操作,它是沿某一个维的概念分层向下或引入新的维来实现;其它OLAP操作“钻过”(DrillAcross)是指对多个事实表进行查询;“钻透”(DrillThrough)是指对立方体操作时,利用数据库关系,钻透立方体的底层,进入后端的关系表。OLAP的其它操作还有统计表中最高值和最低值的项数,计算平均值、增长率、利润、投资回报率等统计计算。多维数据模型的实现RelationalOLAP(ROLAP)(关系数据库)利用关系数据库来存储和管理基本数据和聚合数据,并利用一些中间件来支持缺失数据的处理,具有良好的可扩展性Mu
8、ltidimensionalOLAP(MOLAP)利用多维数据库来存放和管理基本数据和聚合数据,其中需要对稀疏矩阵处理技术对预综合的数据进行快速索引HybridOLAP(HOLAP)利用关系数据库来存储和管理基本数据,利用多维数据库来存储和管理聚合数据。多维数据的组织存放(细节数据)关系数据库中的数据组织多维数据库中的数据组织MDB方法的优点(
此文档下载收益归作者所有