数据仓库与OLAP技术概述.ppt

数据仓库与OLAP技术概述.ppt

ID:50383551

大小:205.00 KB

页数:28页

时间:2020-03-08

数据仓库与OLAP技术概述.ppt_第1页
数据仓库与OLAP技术概述.ppt_第2页
数据仓库与OLAP技术概述.ppt_第3页
数据仓库与OLAP技术概述.ppt_第4页
数据仓库与OLAP技术概述.ppt_第5页
资源描述:

《数据仓库与OLAP技术概述.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第三章数据仓库与OLAP技术概述数据仓库综合和合并多维空间的数据。构造数据仓库涉及数据清理、数据集成和数据变换,可以看作数据挖掘的一个重要预处理步骤。此外,数据仓库提供联机分析处理(OLAP)工具,用于这种粒度的多维数据的交互分析,有利于有效的数据泛化和数据挖掘。很多数据挖掘功能都可以与OLAP操作集成,以加强多个抽象层上的交互知识挖掘。数据仓库已经成为数据分析和联机分析处理日趋重要的平台。第一节、数据仓库■、数据的定义数据仓库是一个面向主题的、集成的、时变的和非易失的数据集合。数据仓库的关键特征:●面向主题的:数据仓库围绕一些主题如顾客、供应商等来组织。●集成的:通常,构造数据仓库是将多个异

2、构数据源集成在一起。●时变的:数据存储从历史的角度提供信息。●非易失的:数据仓库总是物理地分别存放数据。概言之,数据仓库是语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需要的信息。数据仓库常常被看作一种体系结构,通过将异构数据源中的数据集成在一起而构造,支持结构化和专门化的查询、分析报告和决策制定。■、操作数据库系统与数据仓库的区别联机操作数据库系统的主要任务是执行联机事务和查询处理。这种系统称作联机事务处理系统(OLTP)。数据仓库系统在数据分析和决策方面为用户或知识工人提供服务,这种系统可以用不同的格式组织和提供数据,以满足不同用户的各种需求。这种系统称作联机

3、分析处理(OLAP)系统。OLTP和OLAP的主要区别概述如下:●用户和系统的面向性不同:OLTP系统是面向顾客的;OLAP系统是面向市场的,用于知识工人的数据分析。●数据内容不同:OLTP系统管理当前数据。通常,这种数据太琐碎,难以用于决策;OLAP系统管理大量历史数据,提供汇总和聚集机制,并在不同粒度级别上存储和管理信息。●数据库设计:通常,OLTP系统采用实体-联系(ER)数据模型和面向应用的数据库设计;OLAP系统通常采用星型或雪花模型和面向主题的数据库设计。●视图不同:OLTP系统主要关注企业或部门内部的当前数据,而不涉及历史数据或不同组织的数据;相比之下,OLAP系统常常跨越数据库

4、模式的多个版本,OLAP系统还处理来自不同组织的信息,由多个数据存储集成的信息。●访问模式不同:OLTP系统的访问模式主要由短的原子事务组成,这种系统需要并发控制和恢复机制;对OLAP系统的访问大部分是只读操作。第二节多维数据模型数据仓库和OLAP工具基于多维数据模型,这种模型将数据看作数据立方体形式。■由表和电子数据表到数据立方体数据立方体允许从多维对数据建模和观察,它由维和事实定义。一般,维是关于一个组织想要保存记录的透视图和实体;每个维都有一个表与之相关联,称为维表,它进一步描述维。通常,多维数据模围绕中心主题组织,主题用事实表表示,事实是数值度量的。事实表包括事实的名称或度量,以及每个

5、相关维表的码。■多维数据库模式:星型、雪花型和事实星座型最流行的数据仓库数据模型是多维模型,这种模型可以以星型模型、雪花模型或事实星座模型模式形式存在。●星型模型其中数据仓库包括:中心表(事实表);一组小的附属表(维表),每维一个。在星型模型中,每维只用一个表表示,而每个表包含一组属性。●雪花型模型雪花型模型是星型模型的变种,其中某些维表是规范化的,因而把数据进一步分解到附加的表中。●事实星座形复杂的应用可能需要多个事实表共享维表,这种模式可以看作星形模式的汇集。■定义星型、雪花型和事实星座形模型的例子数据挖掘查询语言可以用于说明数据挖掘任务,特殊地,我们考察如何用基于SQL的数据挖掘查询语言

6、DMQL定义数据仓库和数据集市。数据仓库和数据集市可以使用两种语言原语定义:一种是立方体定义,一种是维定义。■度量的分类和计算度量根据所用的聚集函数类型可以分为三类:●分布的●代数的●整体的■概念分层概念分层定义一个映射序列,将低层概念映射到更一般的较高层概念。许多概念分层隐含在数据库模式中,若维的属性按全序相关,,形成一个概念分层、维的属性也可以组织成偏序,形成一个格。概念分层为数据库模式中属性的全序或偏序称作模式分层。也可以通过将给定维或属性的值离散化或分组来定义概念分层,产生集合分组分层。■多维数据模型中的OLAP操作●上卷上卷操作通过沿一个维的概念分层向上攀升或者通过维归约,对数据立方

7、体进行聚集。沿概念分层向上攀升,对数据按较高层的概念进行分组;当用维进行上卷时,一个或多个维从给定的立方体中删除。●下钻下钻是上卷的逆操作,它由不太详细的数据到更详细的数据。下钻可以通过沿维的概念分层向下或引入附加的维来实现。●切片和切块切片操作对给定立方体的一个维进行选择,导致一个子立方体;切块操作通过对两个或多个维执行选择,定义子立方体。●转轴(旋转)转轴是一种可视化操作,它转动数据的视角,提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。