数据仓库构建实施方法及步骤

数据仓库构建实施方法及步骤

ID:44197094

大小:50.00 KB

页数:7页

时间:2019-10-19

数据仓库构建实施方法及步骤_第1页
数据仓库构建实施方法及步骤_第2页
数据仓库构建实施方法及步骤_第3页
数据仓库构建实施方法及步骤_第4页
数据仓库构建实施方法及步骤_第5页
资源描述:

《数据仓库构建实施方法及步骤》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、数据仓库构建实施方法及步骤作者:杨林出处:计算机世界网责任编辑:J•-凡

2、2004-12-3009:46]数据仓库是而向主题的、集成的、不町更新的、随时间的变化1佃不断变化的,这些特点决定了数据仓库的系统设计不能采用同开发传统的OLTP擞据库一样的设计方法。数据仓库系统的原始需求不明确,不断变化与增加,开发者最初不能确切了解到用户的明确而详细的需求,用户所能提供的无非是需求的大的方向以及部分需求,更不能较准确地预见到以后的需求。因此,采用原型法來进行数据仓库的开发是比较合适的,因为原型法的思想是从构建系统的简单

3、的慕木框架着手,不断丰富与完善整个系统。但是,数据仓库的设计开发又不同于一般意义上的原型法,数据仓库的设计是数据驱动的。这是因为数据仓库是在现存数据库系统基础上进行开发,它着眼于冇效地抽取、综合、集成和挖掘已冇数据库的数据资源,服务于金业高层领导管理决策分析的需要。但需要说明的是,数据仓库系统开发是一个经过不断循环、反馈而使系统不断增长与完善的过程,这也是原型法区别于系统生命周期法的主要特点。因此,在数据仓库的开发的整个过程中,自始至终要求决策人员和开发者的共同参与和密切协作,要求保持灵活的头脑,不做或尽量少做

4、无效工作或重复工作。数据仓库的设计大体上可以分为以下儿个步骤:概念模型设计;技术准备工作;逻辑模型设计;物理模型设计;数据仓库生成;数据仓库运行与维护。下而我们六个主要设计步骤为主线,介绍在各个设计步骤中设计的基本内容。第一节概念模型设计进行概念模型设计所要完成的工作是:v1>界定系统边界<2>确定主要的主题域及其内容概念模型设计的成果是,在原冇的数据库的皋础上建立了一个较为稳固的概念模型。因为数据仓库是对原有数据库系统屮的数据进行集成和重组而形成的数据集合,所以数据仓库的概念模型设计,首先要对原冇数据库系统加

5、以分析理解,看在原冇的数据库系统中“冇什么”、“怎样组织的”和“如何分布的”等,然后再來考虑应当如何建立数据仓库系统的概念模型。一方面,通过原存的数据库的设计文档以及在数据字典屮的数据库关系模式,可以对企业现有的数据库中的内容有一个完整而清晰的认识;另一方血,数据仓库的概念模型是面向金业全局建立的,它为集成来白各个面向应用的数据库的数据捉供了统一的概念视图。概念模型的设计是在较高的抽象层次上的设计,因此建立概念模型时不用考虑具体技术条件的限制。1界定系统的边界数据仓库是血向决策分析的数据库,我们无法在数据仓库设

6、计的最初就得到详细而明确的需求,但是一些基木的方向性的需求还是摆在了设计人员的面前:•要做的决策类型有哪些?•决策者感兴趣的是什么问题?•这些问题需要什么样的信息?•要得到这些信息需要包含原有数据库系统的哪些部分的数据?这样,我们可以划定一个当前的大致的系统边界,集中精力进行最需要的部分的开发。因而,从某种意义上讲,界定系统边界的工作也对以看作是数据仓库系统设计的需求分析,因为它将决策者的数据分析的需求用系统边界的定义形式反映出来。2确定主要的主题域在这一步屮,要确定系统所包含的主题域,然后对每个主题域的内容进

7、行较明确的描述,描述的内容包括:・主题域的公共码键;•主题域之间的联系;•充分代表主题的属性组。第二节技术准备工作这一阶段的工作包括:技术评估,技术环境准备。这一阶段的成果是:技术评估报告、软换件配置方案、系统(软、硕件)总体设计方案。管理数据仓库的技术要求与管理操作型环境屮的数据与处理的技术要求区别很人,两者所考虑的方面也不同。我们Z所以在一般悄况下总是将分析型数据与操作型数据分离开來,将分析型数据单独集中存放,也就是用数据仓库来存放,技术耍求上的差界是一个重耍原因。1技术评估进行技术评估,就是确定数据仓库的

8、各项性能指标。一般情况下,需要在这一步里确定的性能指标包括:•管理大数据量数据的能力;•进行灵活数据存取的能力;•根据数据模型重组数据的能力;•透明的数据发送和接收能力:•周期性成批装载数据的能力;•可设定完成时间的作业管理能力。2技术环境准备一旦数据仓库的体系化结构的模型大体建好后,下一步的工作就是确定我们应该怎样来装配这个体系化结构模型,主要是确定对软碾件配宜的要求;我们主要考虑相关的问题:•预期在数据仓库上分析处理的数据量冇多大?・如何减少或减轻竞争性存取程序的冲突?•数据仓库的数据量有多大?•进出数据仓

9、库的数据通信址有多人?等等。根据这些考虑,我们就可以确建各项软硕件的配备要求,并且在这•步工作结束时各项技术准备工作应已就绪,可以装载数据了。这些配备有:•有接存取设备(DASD);•网络;•管理宜接存取设备(DASD)的操作系统;•进出数据仓库的界而(主要是数据査询和分析工具);管理数据仓库的软件,日前即选用数据库管理系统及何关的选件,购买的DBMS产品不能满足管理数据仓库需要的,还

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。