欢迎来到天天文库
浏览记录
ID:44587937
大小:427.45 KB
页数:18页
时间:2019-10-23
《【精品】10客户管理》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第十章数据仓库学习目标通过木章的学习了解数据仓库的产生过程,掌握数据仓库的定义及特点。了解数据仓库的体系结构。了解数据仓库小的数据抽取、数据清理、数据转化、外部数据、丿力史数据、元数据等相关概念。了解数据集市和操作数据存储的概念及应用。了解多维数据丿牟的相关概念,重点掌握多维数据模型上的OLAP分析动作。了解数据仓库模型设计的过程,重点了解数据仓库企业模型的设计。了解数据仓库的应用,掌握数据仓库投资效益分析的方法。10.1数据仓库基本概念10.1.1数据仓库的产生随着数据库技术的广泛应用,企业拥冇了越来越多的数据。如何
2、高效、快速地使用这些数据,并从中得到有价值的信息已成为信息技术需要解决的一个问题。而目前的情况是,企业建立了企业级数据库,各部门针对自己关心的问题,乂在企业级数据库中抽取相关的数据组成部门级数据阳。随看数据的逐层抽取,数据访问变的错综复杂。由于各部门分别抽取数据,针对同一问题抽取的数据内容也不尽相同,若他们均以自己抽取的数据进行分析,得到的结论也会产生差异甚至截然相反。可见,传统的关系型数据库无法满足分析数据、支持决策的需求。这势必要求分析型数据环境的产生。数据仓库就是在此时产生的。数据仓库的产住将企业的数据处理分为两
3、部分。传统的关系数据库处理金业的H常事务,数据仓库则用于分析数据中隐含的信息,以支持决策。10.1.2数据仓库与数据库的区别数据仓库与传统数据库在许多方面冇很大的差异。通过对数据仓库和数据库的对比也更易理解数据仓库的含义。表10-1体现了数据仓库和数据库的区别,从表屮我们可以看到,数据库只存储当询数据,而数据仓库存放历史数据;数据库主要而向业务操作,而数据仓库面向数据分析和决策支持;数据库中的数据是动态变化的,随时刷新,而数据仓库中的数据是静态的,一般不会改变:数据库的使用频率比数据仓库使用的频率高,数据访问最少,且要
4、求的响应时间短。表10-1数据仓库和数据库的区别特性数据库数据仓库数据当前数据历史数据面向业务操作数据分析存取读写操作多为只读使用频率—A—
5、;较低数据访问量少多要求的响应时间较短可以很长关注数据输入信息输出10.1.3数据仓库的定义著名的数据仓库专家W.H.Tnmon在《BuildingtheDataWarehouse》一书中给数据仓库的定义是:数据仓库(DataWarehouse)是一个面向主题的(Subject0riented)^集成的(Integrated)非易失的(Non-Volatile)、随时间变化的(T
6、imeVariant)数据集合,用于支持管理决策。该定义指岀了数据仓库的四个特性:而向主题、集成性、非易失性和时变性。(1)面向主题的特性在数据仓库中,所冇的数据都是围绕一定的主题进行组织的。在关系数据库,针对同一主题的数据分布在相关的各个数据表中,而在数据仓库中,针对同一主题的数据存放在同一数据表中,这样,在分析数据时管理者可以在数据仓库中方便的找到包含他关心的主题的所有数据。这就是数据仓库而向主题的特性。(2)集成性数据仓库中的数据都是经过清洗、过滤、转换的。它们冇统一的格式、表示方式、代码含义、相同的单位表示。消
7、除了源数据屮结构、表示方式、含义的不一致性,数据仓库屮的数据具有集成性。(3)非易失性关系数据库小的数据是实时更新的,需要经常进行添加、更改,而且它只能保存短期内的数据。对于支持决策,历史数据是非常重要的。而数据仓库中的数据一旦写入,几乎就不再更改了,除非数据冇错误,而对数据仓库进行的主要操作只是数据追加,因此数据仓库中的数据相对是稳定的,而JI提供了足够的数据。因此说数据仓库中的数据是非易失的,或者说是稳定的。(4)时变性数据仓库中的数据只增不删的,所以它记录了从开始使用数据仓库起的所有数据,它能反映企业各个时期的信
8、息,也可以说它反映的是企业数据的动态变化。这对于决策分析也是至关重要的。数据仓库的四个特性也从各自的角度反映了数据仓库利于决策分析的特点。10.2数据仓库的基本原理10.2.1数据仓库的体系结构数据仓库的体系结构可以用图10-1来表示。由于数据库和数据仓库应用的出发点不同,因此数据仓库与业务数据库系统是相互独立的,但是数据仓库乂同业务数据库密切相关。图10-1数据仓库的体系结构数据挖掘系统傲据展现锵tr卫—I数据集廿企业外諭据数据仓库存储I数据I元数据tr数聒清洗数据提取JxV""提取仓库业务操律系统廿从数据仓库的体系
9、统结构图中可以看到,数据仓库不是简单地对数据进行存储,而是对数据进行“再组织”。10.2.2数据仓库的相关概念要了解数据仓库,首先要了解数据仓库中的数据抽取、数据清理、数据转化、外部数据、历史数据、元数据等相关概念。(1)数据抽取数据提取是指从外部数据源屮收集数据。它提供建立数据仓库所需要的数据。数据仓库是在数据库的基础上建立起来
此文档下载收益归作者所有