欢迎来到天天文库
浏览记录
ID:59488853
大小:1.59 MB
页数:42页
时间:2020-09-13
《第三章联机分析处理ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、《数据仓库与数据挖掘》主讲:王名扬信息与计算机工程学院2引言仅仅把数据存储在数据仓库之中,利用一定的方法对其安全有效的管理,并不是用户的最终目的。建立数据仓库的目的,是要为决策提供必要的支持。为此,必须使用适当的技术和工具,对数据仓库中的数据进行分析,以实现最终的决策支持目标。OLAP是一门比较成熟的分析技术,在数据仓库领域中应用最广。3.1OLAP概述3.2OLAP的分析方法3.3OLAP的数据组织第3章4学习目的理解OLAP与DW、OLTP的关系。掌握OLAP的分析方法;了解OLAP的数据组织方式。3.1OLAP概述OLAP的基本概念?几个关系?OLAP的特性?1.OLAP的基本概念?
2、OLAP的发展背景60年代,关系数据库之父E.F.Codd提出了关系模型,促进了联机事务处理(OLTP)的发展。1993年,E.F.Codd提出了OLAP概念,认为OLTP已不能满足终端用户对数据库查询分析的需求,SQL对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析需求对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,E.F.Codd提出了多维数据库和多维分析的概念,即OLAP。7什么是OLAP?定义1:OLAP是针对特定问题的联机数据访问和分析处理。通过对信息的多种可能形式进行快速、稳定、一致的交互式存取,允许决策制定者对数据进行
3、深入的观察。定义2:OLAP是一种软技术,它使分析人员能迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。OLAP的目标是满足决策支持或多维环境下特定的查询和报表需求,其技术核心是“维”这一概念,因此OLAP也可以说是多维数据分析工具的集合。82.几个关系?101)OLAP与DW?数据仓库和OLAP都是20世纪90年代初提出的概念,到90年代中期已形成潮流。数据仓库是市场竞争的产物,其目标是进行有效的数据分析,为决策者提供支持。随着数据仓库的发展,OLAP也得到了迅速的发展。虽然数据仓库和联机分析处理,这两个术语有时可互换,但他们却适用于通常称为DSS或业务智能系统的不同组件
4、。OLAP与DW?111)OLAP与DW?数据仓库侧重于存储和管理面向主题的数据;而OLAP则侧重于数据仓库中的数据分析,并将其转换成辅助决策的信息。OLAP的一个重要特点是多维数据分析,这与数据仓库的多维数据组织管理正好形成相互结合、相互补充的关系。OLAP技术使数据仓库能够快速响应重复而复杂的分析查询,从而使数据仓库能有效地用于联机分析。121)OLAP与DW?OLAP与DW的关系132)OLAP与OLTPOLTP(On-LineTransactionProcessing):是传统的关系型数据库的主要应用,包括记录实时的增、删、改、查,主要是面向基本的、日常的事务处理,如银行交易。OL
5、AP(On-LineAnalyticalProcessing):是数据仓库的主要应用,支持复杂的分析操作,侧重决策支持,并提供直观易懂的查询结果。OLTPvs.OLAP14OLAP&OLTP的主要区别(1)15OLAP&OLTP的主要区别(2)163.OLAP的特性?OLAP特性快速性-用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对用户的大部分分析要求做出反应。可分析性-OLAP系统应能处理与应用有关的任何逻辑分析和统计分析18OLAP特性多维性-多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。信息性-不论数据量有多大,也不
6、管数据存储在何处,OLAP系统应能及时获得信息,并且管理大容量信息。19切片(Slice)从多维数组选定一个二维子集,切出一个“平面”切块(Dice)从多维数组选定一个三维子集,切出一个“立方体”旋转(Rotate)改变一个报告(或页面)显示的维方向钻取(Drill)根据维层次,改变数据的粒度3.2OLAP的分析方法20相关基本概念维:是人们观察数据的特定角度,是考察问题时的一类属性,属性集合构成一个维(时间维、地理维等)。维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。维的成员:维的一个取值。是数据项在某维中位置的描述
7、。(“某年某月某日”是在时间维上位置的描述)多维数组:维和变量的组合表示。一个多维数组可以表示为(维1,维2,…,维n,变量)。(时间,地区,产品,销售额)数据单元(单元格):多维数组的取值。(2000年1月,上海,笔记本电脑,¥10000)21(1)切片与切块1)切片:定义1:在多维数组的某一维上选定一个维成员,即从n维数组选取n-1维子集.(降维操作)设多维数组(维1,维2,…,维n,变量),在维i上,选定维成员Vi
此文档下载收益归作者所有