欢迎来到天天文库
浏览记录
ID:22790599
大小:355.00 KB
页数:15页
时间:2018-10-31
《《数据仓库》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、数据仓库目录数据仓库1目录11.1产生背景21.2定义31.3特点41.2.1面向主题51.2.2集成的51.2.3相对稳定的51.2.4反映历史变化51.4数据库和数据仓库61.5实现方式61.6体系结构71.6.1数据源71.6.2数据的存储与管理71.6.3OLAP(联机分析处理)服务器71.6.4前端工具71.7组成81.7.1数据仓库数据库81.7.2数据抽取工具81.7.3元数据81.7.4访问工具91.7.5数据集市(DataMarts)91.7.6数据仓库管理101.7.7信息发布系统101.8数据仓库带来了什么101.9建立数据
2、仓库101.9.1为什么要建立数据仓库101.9.2实施应注意的问题112.0数据仓库和数据集市142.1数据仓库与数据库的关系151.1产生背景数据仓库是伴随着数据库技术的发展及用户对数据加工、处理要求的不断变化而产生的。在传统的数据库技术中,数据库技术的应用主要表现在联机事务处理(OLTP)方面。联机事务处理注重数据处理的响应时间、数据的安全性和完整性,通过对数据库的联机操作(增、删、改、查询)来实现特定的应用。目前,联机事务处理仍然是数据库应用的一个主要方面,关系型数据库经过多年的发展具有很强的联机处理能力,成为传统数据库技术的主流。 当
3、联机事务处理系统应用到一定阶段后,用户慢慢发现单靠联机事务处理已经难以满足经济全球化条件下的激烈的市场竞争,用户很难在原有的数据库中找到能够为他们的决策提供翔实和可靠依据的综合信息。企业为了保持在市场竞争中的优势,迫切需要对其自身的经营管理情况、客户情况、市场情况以及相关行业的情况进行分析,并据此做出有利的决策,这种决策需要通过对大量业务数据(包括历史数据)进行分析才能得到。数据库技术的另一个应用方向就在这样的需求背景下产生了,那就联机分析处理(OLAP)。与联机事务处理不同,联机分析处理注重于数据的查询和获取。传统的数据库技术是面向应用的,企业
4、往往针对不同的应用建立不同的数据库,甚至选用不同的数据库管理系统(DBMS),因此,企业的业务数据分散地存储在不同的数据库(可能是同构的,也可能是异构的)中,不易于统一查询访问,而且大量的历史数据脱机存放,无法进行联机查询,在此情况下对数据进行综合分析时,其结果往往缺乏可靠性且数据处理的效率很低。针对这种情况,为了适应企业发展和市场竞争的需要,人们设想建立一种数据中心,数据中心的数据从原有的多个用于联机事务处理的数据库中抽取得来,这个数据中心专门用于数据的分析,为企业决策提供支持和服务,这就是数据仓库的雏形。数据仓库的概念一经提出就得到了业界的重
5、视,发展也很迅速。1.2定义数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。数据仓库之父WilliamH.Inmon在1991年出版的“BuildingtheDataWarehouse”一书中所提出的定义被广泛接受——数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Vo
6、latile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策(DecisionMakingSupport)。(图1数据仓库的核心工具)1.3特点数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。为了更好地为前端应用服务,数据仓库往往有如下几点特点:1.效率足够高。数据仓库的分析数据一般分为日、周、月、季、年等,可以看出,日为周期的数据要求的效率最高,要求24小时甚至
7、12小时内,客户能看到昨天的数据分析。由于有的企业每日的数据量很大,设计不好的数据仓库经常会出问题,延迟1-3日才能给出数据,显然不行的。2.数据质量。数据仓库所提供的各种信息,肯定要准确的数据,但由于数据仓库流程通常分为多个步骤,包括数据清洗,装载,查询,展现等等,复杂的架构会更多层次,那么由于数据源有脏数据或者代码不严谨,都可以导致数据失真,客户看到错误的信息就可能导致分析出错误的决策,造成损失,而不是效益。3.扩展性。之所以有的大型数据仓库系统架构设计复杂,是因为考虑到了未来3-5年的扩展性,这样的话,未来不用太快花钱去重建数据仓库系统,就
8、能很稳定运行。主要体现在数据建模的合理性,数据仓库方案中多出一些中间层,使海量数据流有足够的缓冲,不至于数据量大很多,就运行不起来了。从
此文档下载收益归作者所有