数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt

数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt

ID:53279395

大小:805.54 KB

页数:70页

时间:2020-04-18

数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt_第1页
数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt_第2页
数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt_第3页
数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt_第4页
数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt_第5页
资源描述:

《数据仓库的数据模型、数据组织、数据仓库设计(学时2).ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据仓库与数据挖掘(DATAWAREHOUSINGANDDATAMINING)石家庄铁道大学内容第2章数据仓库的数据模型第3章数据仓库的数据组织第4章数据仓库设计2021/9/9--第2章数据仓库的数据模型本章要点数据仓库的概念模型:信息包图数据仓库的逻辑模型:星型图、雪花模型数据仓库的物理模型2021/9/9--数据仓库的数据模型-与数据库系统数据模型的区别数据仓库的数据模型中不包含纯操作型数据。数据仓库的数据模型扩充了键结构,增加了时间属性作为键的一部分。数据仓库的数据模型中增加了一些面向主题的导出数据。2021/9/9--星型图模型物理数据模型概念模型逻辑模型物理模型面向用户的

2、需求细化层次更详细的技术细节数据仓库的数据模型信息包图2021/9/9--信息包图(概念模型)信息包图:是数据仓库的数据模型的第一层或最高层。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。而信息包图简化了这一过程并且允许用户设计多维信息包并与开发者和其他用户建立联系。这种模型集中在用户对信息包的需要,信息包提供了分析人员思维模式的可视化表示。工作:确定系统边界:决策类型、需要的信息、原始信息确定主题域及其内容:主题域的公共键、联系、属性组确定维度:如时间维、销售位置维、产品维、组别维等确定类别:相应维的详细类别确定指标和事实:用于进行分析的数值化信息202

3、1/9/9--信息包:维度类别空白信息包图样式指标和事实2021/9/9--解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实:(1)维度:包括日期维、销售地点维、销售产品维、年龄组别维、性别维等。(2)类别:确定各维的详细类别,如:日期维包括年(10)、季度(40)、月(120)等类别,括号中的数字分别指出各类别的数量;销售地点维包括国家(15)、区域(45)、城市(280)、区(880)、商店(2000)等类别,括号中的数字同样分别指出各类别的数量;类似地,可以确定销售产品、年龄组别维、性别维等的详细类别。(3)指标和事实:确定用于进行分析的数值化信息,包括预测销

4、售量、实际销售量和预测偏差等。〖例〗试画出销售分析的信息包图2021/9/9--销售分析的信息包图日期销售地点销售产品年龄组别性别年(10)国家(15)产品类(6)年龄组(8)性别组(2)季度(40)区域(45)产品组(48)月(120)城市(280)产品(240)区(880)商店(2000)指标和事实:预测销售量、实际销售量、预测偏差信息包:销售分析维度类别2021/9/9--星型图模型(逻辑模型)星型图:数据仓库的数据模型的第二层是向最终的数据结构添加某些细节的星型图模型。与传统的关系模型相比,星型图模型简化了用户分析所需的关系,从支持决策的角度去定义数据实体,更适合大量复杂查询

5、。星形图包括了三种逻辑实体:指标、维度、详细类别2021/9/9--〖例〗销售分析的星型图模型。日期维产品维地区维代理商维其他维销售分析实际销售预测销售预测偏差在星型图中,通过维度实体获得指标实体数据。指标实体与维度实体间的联系通过每个维度中的最低层的详细类别实体连接。2021/9/9--在很多情况下,维度实体还要向外延伸至详细类别实体,或者说,详细类别实体是维度实体的附加信息,是维度实体的扩展,说明了维度实体间的关系。这种在维度实体上扩展详细类别实体的星形图称为雪花图。2021/9/9--雪花图模型(逻辑模型)雪花模型包括了三种逻辑实体:指标、维度、详细类别。雪花模型通常由一个很大

6、的中心表(指标表)和一组较小的表(维表)组成。雪花模型的指标表与所有的维表都要进行连接。日期维产品维地区维代理商维其他维销售分析实际销售预测销售预测偏差年、月、日国家、地区、城市类别、型号、产品名称城市、区、名称2021/9/9--物理模型物理数据模型:数据模型的第三层,它是星型图模型在数据仓库中的实现,如物理的存取方式、数据存储结构等。在物理设计时,常常要按数据的重要程度、使用频率以及对响应时间的要求进行分类,并将不同类的数据分别存储在不同的存储设备中。重要程度高、经常存取并对响应时间高的数据就存放在高速存储设备上,如硬盘;存取频率低或对存取响应时间要求低的数据则可以放在低速存储设

7、备上。2021/9/9--第3章数据仓库的数据组织本章要点数据仓库中的数据组织粒度与分割数据仓库的数据追加2021/9/9--数据仓库中的数据存在着不同的综合级别早期细节级当前细节级轻度综合级高度综合级粒度:数据的不同综合级别粒度越大、表示细节程度越低、综合程度越高。级别的划分是根据粒度进行的数据仓库中的数据组织2021/9/9--数据仓库的数据组织结构高度综合级轻度综合级当前细节级早期细节级2021/9/9--数据仓库的数据组织结构高度综合级轻度综合级当

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。