数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt

数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt

ID:51743146

大小:356.00 KB

页数:82页

时间:2020-03-30

数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt_第1页
数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt_第2页
数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt_第3页
数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt_第4页
数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt_第5页
资源描述:

《数据仓库与数据挖掘基础第2章OLAP(赵志升)XXXX修改.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、河北北方学院:赵志升数据仓库与数据挖掘DataWarehouseandDataMining4.1OLAP概念、特点与分类4.2OLAP的基本操作4.3OLAP的数据模型4.4基于多维数据库的OLAP(MOLAP)4.5基于关系数据库的OLAP(ROLAP)4.6OLAP实现4.7OLAP的衡量和特性第4章联机分析处理4.1OLAP的定义、特点OLAP(On-LineAnalysisProcessing)定义是数据仓库上的分析展示工具,它建立在数据多维视图的基础上。联机分析处理。OLAP的主要特点一是在线性(OnLine),体现为对用户请求的快速响应和交互式操

2、作;二是多维分析(Multi_Analysis),这是OLAP技术的核心所在。4.1OLAP的定义和特点Codd提出了多维数据库和多维分析的概念,即OLAP。OLAP委员会对联机分析处理的定义为:使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。4.1OLAP的定义和特点整个数据(仓)库

3、系统的工具层大致可以分为三类,或者说三个发展阶段:(1)以MIS为代表的查询、报表类工具(2)以OLAP为代表的验证型工具(3)以及以DM为代表的挖掘型工具4.1OLAP的分类OLAP系统按照其存储器的数据存储格式可以分为关系OLAP(RelationalOLAP,简称ROLAP)、多维OLAP(MultidimensionalOLAP,简称MOLAP)和混合型OLAP(HybridOLAP,简称HOLAP)三种类型。1.ROLAPROLAP将分析用的多维数据存储在关系数据库中并根据应用的需要有选择的定义一批实视图作为表也存储在关系数据库中。不必要将每一个S

4、QL查询都作为实视图保存,只定义那些应用频率比较高、计算工作量比较大的查询作为实视图。对每个针对OLAP服务器的查询,优先利用已经计算好的实视图来生成查询结果以提高查询效率。同时用作ROLAP存储器的RDBMS也针对OLAP作相应的优化,比如并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、SQL的OLAP扩展(cube,rollup)等等。4.1OLAP的分类1.ROLAP存储模式使得分区的聚合存储在关系数据库的表(在分区数据源中指定)中。但是,可为分区数据使用ROLAP存储模式,而不在关系数据库中创建聚合。同样,如果分区源数据存储在SQLS

5、erver2000中,而且满足特定条件,则将创建索引视图而不创建表。与MOLAP存储模式不同,ROLAP不会使源数据的复本存储起来;当结果无法从聚合或客户端高速缓存派生时,将访问分区的事实数据表以回答查询。在ROLAP存储模式下,查询响应一般较其它两种存储模式下要慢。ROLAP通常用于不经常查询的大数据集,如年份较早的历史数据。4.1OLAP的分类2.MOLAPMOLAP将OLAP分析所用到的多维数据物理上存储为多维数组的形式,形成“立方体”的结构。维的属性值被映射成多维数组的下标值或下标的范围,而总结数据作为多维数组的值存储在数组的单元中。由于MOLAP采

6、用了新的存储结构,从物理层实现起,因此又称为物理OLAP(PhysicalOLAP);而ROLAP主要通过一些软件工具或中间软件实现,物理层仍采用关系数据库的存储结构,因此称为虚拟OLAP(VirtualOLAP)。4.1OLAP的分类2.MOLAPMOLAP存储模式使得分区的聚合和其源数据的复本以多维结构存储在分析服务器计算机上。根据分区定义为是本地分区还是远程分区,该计算机可以是定义分区的分析服务器计算机,或别的分析服务器计算机。用于存储分区数据的多维结构位于分析服务器Data文件夹的子文件夹中。由于分析服务器计算机上驻留有源数据的一个复本,所以即使查询

7、结果无法从分区的聚合中获得,也可以不用访问分区的源数据而解决查询。根据分区聚合的百分比和设计,MOLAP存储模式为达到最快查询响应时间提供了潜在可能性。总而言之,MOLAP更加适合于频繁使用的多维数据集中的分区和对快速查询响应的需要。4.1OLAP的分类4.1OLAP的分类3.HOLAP由于MOLAP和ROLAP有着各自的优点和缺点(如下表所示),且它们的结构迥然不同,这给分析人员设计OLAP结构提出了难题。为此一个新的OLAP结构——混合型OLAP(HOLAP)被提出,它能把MOLAP和ROLAP两种结构的优点结合起来。迄今为止,对HOLAP还没有一个正式

8、的定义。但很明显,HOLAP结构不应该是MOLAP与

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。