崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx

崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx

ID:52848871

大小:568.71 KB

页数:28页

时间:2020-03-26

崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx_第1页
崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx_第2页
崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx_第3页
崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx_第4页
崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx_第5页
资源描述:

《崔巍 数据库系统及应用第4版1202数据仓库与分析服务.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1数据仓库与分析服务DataWarehouse?随着数据库技术的普及和应用领域的日益广泛,人们对数据管理提出了更高的要求,不仅仅希望数据库能够完成日常信息管理和信息处理的任务,还希望能够利用日积月累下的大量数据获得决策支持方面的服务。DataBase&2什么是数据仓库?数据仓库是支持管理决策过程的、面向主题的、集成的、随时间而增长的持久的数据集合。OLTP与OLAP数据库上的业务处理称作OLTP(On-LineTransactionProcessing),即联机事务处理;而数据仓库上的业务处理称作OLAP(On-LineAnalyticalProcessing),即联机分析处理。3数据仓

2、库的基本特征面向主题:可以根据最终用户的观点组织和提供数据。管理大量信息:数据仓库含有大量历史数据。信息存储在多个存储介质上:因为必须管理大量的信息,所以数据仓库的数据往往存储在多个介质上。信息的概括和聚集:可以将信息概括和聚集,并以人们易于理解的方式提供出来。从许多数据来源中将信息集成并使之关联:由于数据仓库要管理大量的、且包含历史信息的数据,而这些数据可能和多个应用及多个数据库有关,所以需要数据仓库收集和组织这些应用程序多年来在各场合获得的数据。跨越数据库模式的多个版本:因为数据仓库必须管理和存储历史数据,而这些历史数据在不同时代数据库模式的不同版本之中,所以数据仓库有时还需要处理来

3、自不同数据库的信息。4数据仓库的特点:面向主题寿险财产险机动车险客户操作型数据库是面向特殊处理任务,各个系统之间各自分离数据仓库是按照一定的主题进行组织。一个主题通常与多个操作型信息系统相关。操作型数据库数据仓库5对数据仓库的理解数据仓库用于支持管理和决策,面向分析型数据处理,它不同于企业现有的面向交易的操作型数据库;数据仓库是对多个异构的数据源有效集成,集成后按照主题进行了重组,并包含历史数据。6数据仓库的结构1995年-2017年销售月报1995年-2017年销售周报2012年-2017年销售数据1995年-2011年销售数据7操作型环境和分析型环境在操作型环境中支持分析应用太复杂、

4、太困难需要提供分析型环境为决策、分析提供支撑8数据仓库系统数据仓库不是产品,是基于数据库、管理更大量数据、为分析和决策服务的一种解决方案。基于数据库的……解决方案9数据粒度粒度:数据综合程度高低的一个度量。粒度越小,越细节,回答查询种类越多,数据量大,性能低;相反,粒度越粗回答查询种类越少,原因是数据量小,但是对可回答的问题性能高。例1:1390xxx7899昨天打电话了吗?小粒度可以回答,粗粒度不能回答例2:1390xxx7899上个月日均打出电话几分钟?小粒度回答效率低,粗粒度回答高例3:1390xxx7899今年日均打出电话几分钟?……10数据仓库数据的特点为了提高分析服务的速度需

5、要存储不同粒度的数据。粒度越小,越细节,回答查询种类越多,数据量大,性能低;相反,粒度越粗回答查询种类越少,原因是数据量小,但是对可回答的问题性能高。11不同的查询举例查询去年同一天的销售数据进行对比只能查询细节数据查询历年同一月份的销售数据进行分析可以通过细节数据进行统计,效率低可以直接通过月报查询(已经聚合的综合数据),效率高12操作型数据和分析型数据的对比操作型数据分析型数据细节的综合的,或提炼的在存取瞬间是准确的代表过去的数据可更新不更新操作需求事先可知道操作需求事先不知道符合结构化生命周期完全不同的生命周期对性能要求高对性能要求宽松一个时刻操作一单元一个时刻操作一集合事务驱动分

6、析驱动面向应用面向分析一次操作数据量小一次操作数据量大支持日常业务支持管理需求13数据仓库系统的构成14数据分析与数据挖掘基于数据仓库的决策支持技术是通过数据仓库来转化、综合和管理业务数据库中的大量数据的,因此数据仓库的快速查询可以高效地获得数据。数据挖掘不是一种单一的技术或软件,它综合了数据可视化、机器学习、统计学和数据库技术,通过某种方法在大量数据中发现有用知识,使数据、知识和决策过程成为一个有机的整体,因此,决策支持过程的准确性和实时性都能大大提高。数据仓库和数据挖掘技术已经迅速发展起来,并逐渐成为决策支持的新手段。15数据分析服务分析服务(AnalysisServices)、即O

7、LAP系统等诸多分析或决策应用驱动了数据仓库技术的出现和发展;而数据仓库技术反过来又促进了OLAP技术的发展。OLAP的概念最早由关系数据库之父E.F.Codd于1993年提出,他认为OLTP已不能满足用户对数据库查询分析的要求,SQL对大数据库的简单查询也不能满足用户分析的需求。因此,Codd提出了多维数据库和多维分析的概念。16多维(维度)从不同的角度来审视数据或业务的一种很自然的思考模式。例如对销售数据的分析,可能会综合时间周

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。