数据仓库设计.ppt

数据仓库设计.ppt

ID:51612914

大小:267.00 KB

页数:37页

时间:2020-03-26

数据仓库设计.ppt_第1页
数据仓库设计.ppt_第2页
数据仓库设计.ppt_第3页
数据仓库设计.ppt_第4页
数据仓库设计.ppt_第5页
资源描述:

《数据仓库设计.ppt》由会员上传分享,免费在线阅读,更多相关内容在PPT专区-天天文库

1、数据仓库设计胡正耀09105015一、数据仓库系统结构RDBMS数据文件其他综合数据当前数据历史数据元数据抽取、转换、装载数据仓库OLAP工具DM工具查询工具分析工具报表工具抽取.转换.装载源数据库DW管理工具数据建模工具数据源二、建立DW的两种方式1.自顶向下型“自顶向下”的开发策略是指对原来分散存储在企业各处的OLTP数据库中的有用数据通过提取、清洁、转换、聚集等处理步骤建立一个全局性数据仓库。这个全局的数据仓库将提供给用户一个一致的数据格式,一致的软件环境。从理论上说,决策支持所需的数据都应该包含在这个全局数据仓库中。数据集市中存储的数据是为某个部门的DS

2、S应用而专门从全局数据仓库中提取的,它是全局数据仓库中数据的一个子集。在“自顶向下”的模式中,数据集市和数据仓库的关系是单方向的,即数据从数据仓库流向数据集市。原有数据和应用源抽取、转换、迁移数据仓库数据仓库/数据集市元数据数据集市自顶向下的数据仓库结构二、建立DW的两种方式2.自下向上型“自底向上”模式是从建立各个部门或特定的商业问题的数据集市开始,全局性数据仓库建立在这些数据集市的基础上。“自底向上”模式的特点是初期投资少,见效快,因为它在建立部门数据集市时只需要较少的人做决策,解决的是较小的商业问题。“自底向上”的开发模式可以使一个单位在数据仓库发展初期尽

3、可能少地花费资金,也可以在做出有效的投入之前评估技术的收益情况。原有数据和应用源抽取、转换、迁移数据仓库数据仓库/数据集市元数据数据集市自下向上的数据仓库结构“平行开发”模式是指在一个全局性数据仓库的数据模型的指导下,数据集市的建立和全局性数据仓库的建立同时进行。在“平行开发”模式中由于数据集市的建立是在一个统一的全局数据模型的指导下进行的,可避免各部门在开发各自的数据集市时的盲目性,减少各数据集市之间的数据冗余和不一致。在“平行开发”模式中数据集市的这种相对独立性有利于全局性数据库的建设。一旦全局性数据仓库建立好后,各部门的数据集市将成为全局数据仓库的一个子集

4、#全局数据仓库将负责为各部门已建成和即将要建的数据集市提供数据。二、建立DW的两种方式两种方式的比较:‘自顶向下’的方法是在单个项目阶段中实现数据仓库,需要在项目开始时完成更多计划和设计工作。这就需要涉及参与数据仓库实现的每个工作组、部门或业务线中的人员。要使用的数据源、安全性、数据结构、数据质量、数据标准和整个数据模型的有关决策一般需要在真正的实现开始之前就完成,建设规模往往较大,建设周期长,投资大。二、建立DW的两种方式两种方式的比较:‘自下向上’的实现包含数据仓库的计划和设计,无需等待安置好更大业务范围的数据仓库设计。这并不意味着不会开发更大业务范围的数据

5、仓库设计;随着初始数据仓库实现的扩展,将逐渐增加对它的构建。现在,该方法得到了比自顶向下方法更广泛的接受,因为数据仓库的直接结果可以实现,并可以用作扩展更大业务范围实现的证明。二、建立DW的两种方式两种方式的比较:一种折中方案:每种实现方法都有利弊。在许多情况下,最好的方法可能是某两种的组合。该方法的关键之一就是确定业务范围的架构需要用于支持集成的计划和设计的程度,因为数据仓库是用自底向上的方法进行构建。在使用自底向上或阶段性数据仓库项目模型来构建业务范围架构中的一系列数据集市时,您可以一个接一个地集成不同业务主题领域中的数据集市,从而形成设计良好的业务数据仓库

6、。这样的方法可以极好地适用于业务。在这种方法中,可以把数据集市理解为整个数据仓库系统的逻辑子集,换句话说数据仓库就是一致化了的数据集市的集合。这种方案的实施步骤通常分如下几步: (1)从整个企业的角度定义计划和需求 (2)构建完整的仓库体系结构 (3)使数据内容一致而且标准化 (4)将数据仓库作为一种超级数据集市来实施随着数据仓库技术的发展,数据仓库的实现策略已从原先的“自顶向下”一种模式发展到了六种模式。1、“自顶向下”模式2、“自底向上”模式3、“平行开发”模式为了解决用户需求变化的问题,在业界引入了三种模式。4、“有反馈的自顶向下”模式5、“有反馈的自底向

7、上”模式6、“有反馈的平行开发”模式三、数据仓库构建步骤数据建模概念模型设计逻辑模型设计物理模型设计OLAP应用完善维护系统应用与维护确定系统边界确定主题域总体分析设计技术环境设备三、数据仓库构建步骤1)收集和分析业务需求;2)建立数据模型和数据仓库的物理设计;3)定义数据源;4)选择数据仓库技术和平台;5)从操作型数据库中提取、转换和净化数据到数据仓库;6)选择访问和报表工具;7)选择数据库连接软件;8)选择数据分析和数据展示软件;9)更新数据仓库;三、数据仓库建立的基本框架需求分析运行维护模型设计物理设计技术选择数据处理应用设计应用开发产品选择项目管理四、数

8、据的获取数据仓库所需要的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。