欢迎来到天天文库
浏览记录
ID:50048177
大小:1.25 MB
页数:67页
时间:2020-03-08
《数据库系统教程 教学课件 作者 何玉洁 李宝安 第16章 数据库仓库与数据挖掘.ppt》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、数据库系统教程第16章数据仓库与数据挖掘1第16章数据仓库与数据挖掘16.1数据仓库技术16.2联机分析处理16.3数据挖掘*216.1数据仓库技术16.1.1数据仓库的概念及特点16.1.2数据仓库体系结构16.1.3数据仓库的分类16.1.4数据仓库的开发*3数据仓库技术数据仓库是进行联机分析处理和数据挖掘的基础,它从数据分析的角度将联机事务中的数据经过清理、转换并加载到数据仓库中,这些数据在数据仓库中被合理的组织和维护,以满足联机分析处理和数据挖掘的要求。*4数据仓库的概念及特点面向主题集成的数据数据不可更新数据随时间不断变化使用数据仓库是为
2、了更好的支持制定决策*5面向主题在较高层次上将企业信息系统中的数据综合、归类并进行分析利用,是对企业中某一宏观分析领域所涉及的分析对象,是针对某一决策问题而设置的。面向主题的数据组织方式就是完整、统一地刻画各个分析对象所涉及的企业的各项数据以及数据之间的联系。*6集成的数据数据仓库中存储的数据是从原来分散的各个子系统中提取出来,并经过统一和综合处理。因为:源数据不适合分析处理,在进入数据仓库之前必须抛弃分析处理不需要的数据项,增加一些可能涉及的外部数据。数据仓库每个主题所对应的源数据在原分散数据库中有许多重复或不一致的地方,因而必须消除不一致和错误
3、的地方,以保证数据的质量。*7数据不可更新数据仓库中的数据不可更新,是指当数据被存放到数据仓库之后,最终用户只能进行查询、分析操作,而不能修改其中存储的数据。*8数据随时间不断变化数据仓库中的数据不可更新,并不是说,数据从进入数据仓库以后就永远不变。从数据的内容上看,数据仓库存储的是企业当前的和历史的数据。因而每隔一段固定的时间间隔后,操作型数据库系统产生的数据需要经过抽取、转换过程以后集成到数据仓库中。数据仓库中的数据随时间变化而定期地更新。*9数据仓库体系结构*10操作型数据与分析型数据的区别原始数据/操作型数据导出数据/DSS数据面向应用,支
4、持日常操作面向主题,支持管理需求数据详细,处理细节问题综合性强,或经过提炼存取的瞬间是准确值代表过去的数据可更新不可更新重复运行启发式运行事务处理驱动分析处理驱动非冗余性时常有冗余处理需求事先可知,系统可按预计的工作量进行优化处理需求事先不知道对性能要求高对性能要求宽松用户不必理解数据库,只是输入数据即可用户需要理解数据库,以从数据中得出有意义的结论数据仓库的分类按照数据仓库的规模与应用层面来区分,数据仓库可分为:标准数据仓库。数据集市。多层数据仓库。联合式数据仓库。*12标准数据仓库是最常使用的数据仓库,它依据管理决策的需求而将数据加以整理分析,
5、再将其转换到数据仓库之中。以整个企业为着眼点,与整个企业的数据有关,用户可以从中得到整个组织运作的统计分析信息。*13数据集市是针对某一主题或是某个部门而构建的。一般它的规模会比标准数据仓库小,且只存储与部门或主题相关的数据。通常用于为单位的职能部门提供信息。如:为是销售部门、库存和发货部门、财务部门、高级管理部门等提供有用信息。还可用于将数据仓库数据分段以反映按地理划分的业务,其中每个地区都是相对自治的。*14多层数据仓库是标准数据仓库与数据集市的组合应用方式在整个架构之中,有一个最上层的数据仓库提供者,它将数据提供给下层的数据集市。数据仓库销售
6、数据集市市场数据集市商店数据集市用户用户用户*15数据仓库的开发方法自顶向下,即从全面设计整个企业的数据仓库模型开始。这是一种系统的解决方法,并能最大限度的减少集成问题,但费用高,开发时间长,缺乏灵活性,因为使整个企业的数据仓库模型要达到一致是很困难的。自底向上,从设计和实现各个独立的数据集市开始。这种方法费用低,灵活性高,并能快速的回报投资。*16推荐的数据仓库开发方法*17数据仓库的数据模式典型的数据仓库具有为数据分析而设计的模式,供OLAP工具进行联机分析处理。数据通常是多维的,包括维属性和度量属性:维属性是分析数据的角度度量属性是要分析的数
7、据,一般是数值型包含统计分析数据的表称为事实数据表,通常比较大。*18数据仓库的架构星型架构*19数据仓库的架构(续)雪花型架构*2016.2联机分析处理(OLAP)是专门为支持复杂的分析操作而设计的。侧重于决策人员和高层管理人员的决策支持可以快速、灵活地进行大数据量的复杂查询以直观易懂的形式将查询结果提供给决策人员。以数据库或数据仓库为基础,其最终的数据来源来自底层的数据库系统。*21OLAP与OLTP的区别OLTP面向的是操作人员和底层管理人员,OLAP面向的是决策人员和高层管理人员;OLTP是对基本数据的查询和增、删、改操作处理,它以数据库为
8、基础,OLAP更适合以数据仓库为基础的数据分析。OLAP所依赖的历史的、导出的及经综合提炼的数据均来自OLTP所依赖的底层
此文档下载收益归作者所有