数据仓库系统的设计与开发

数据仓库系统的设计与开发

ID:39267842

大小:552.81 KB

页数:32页

时间:2019-06-29

数据仓库系统的设计与开发_第1页
数据仓库系统的设计与开发_第2页
数据仓库系统的设计与开发_第3页
数据仓库系统的设计与开发_第4页
数据仓库系统的设计与开发_第5页
资源描述:

《数据仓库系统的设计与开发》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第3章数据仓库系统的设计与开发通过对数据仓库的概念、体系结构与存储结构、ETL过程等内容了解以后,如何建立数据仓库系统呢?10/5/20211数据仓库与数据挖掘3.1数据仓库系统的设计与开发概述建立一个数据仓库系统的参考步骤数据仓库系统的生命周期创建数据仓库系统的两种思维模式数据仓库数据库的设计步骤10/5/20212数据仓库与数据挖掘建立一个数据仓库系统的参考步骤数据仓库系统的建立是一个复杂而漫长的过程。涉及到:源数据库系统数据仓库对应的数据库系统数据分析与报表工具……10/5/20213数据仓库与数据

2、挖掘建立一个数据仓库系统的参考步骤收集和分析业务需求步骤建立数据模型和数据仓库的物理设计定义数据源选择数据仓库技术和平台从操作型数据库中抽取、清洗及转换数据到数据仓库选择访问和报表工具,选择数据库连接软件,选择数据分析和数据展示软件更新数据仓库10/5/20214数据仓库与数据挖掘数据仓库系统的生命开发周期数据仓库系统的开发与设计是一个动态的反馈和循环过程。一个数据仓库系统包括:数据仓库数据库数据分析应用系统10/5/20215数据仓库与数据挖掘数据仓库系统的生命开发周期10/5/20216数据仓库与数据

3、挖掘建立数据仓库系统的两种思维模式自顶向下(Top-down)将数据通过ETL汇集到数据仓库中,然后再把数据通过复制的方式存入各个数据集市中。自底向上(Bottom-Up)通过ETL将数据汇集到数据集市中,再将数据汇集到数据仓库中。10/5/20217数据仓库与数据挖掘数据仓库数据库的设计步骤10/5/20218数据仓库与数据挖掘3.2基于SQLServer的数据仓库数据库设计过程详解SQLServer2005介绍集成了三个服务。SQLServer2005的数据仓库架构10/5/20219数据仓库与数据挖

4、掘MSSQLServer2005的数据仓库架构10/5/202110数据仓库与数据挖掘3.2基于SQLServer的数据仓库数据库设计过程详解包括以下步骤:分析组织的业务状况及数据源结构组织需求调研,收集业务需求采用信息包图法进行数据仓库的概念模型设计利用星形图进行数据仓库的逻辑模型设计数据仓库的物理模型设计10/5/202111数据仓库与数据挖掘分析组织的业务状况及数据源结构以SQLServer2005实例数据库AdventureWorksDW中所描述AdventureWorksCycles公司的用户需

5、求为例。公司概况业务系统流程介绍对数据源结构的分析与理解10/5/202112数据仓库与数据挖掘组织需求调研,收集业务需求坚持数据驱动+用户(需求)驱动的设计理体念,因此需要充分了解用户的需求,进而对需求进行分析。关于用户需求的调研(确定主题域)对用户需求调研结果的分析(确定度量指标和维度)10/5/202113数据仓库与数据挖掘物理模型星型、雪花模型物理数据模型概念模型逻辑模型面向用户的需求细化层次更详细的技术细节信息包图采用信息包图法进行概念模型设计10/5/202114数据仓库与数据挖掘信息包图:是

6、数据仓库的数据模型的第一层或最高层。由于大多数商务数据是多维的,但传统的数据模型表示三维以上的数据有一定困难。而信息包图简化了这一过程并且允许用户设计多维信息包并与开发者和其他用户建立联系。这种模型集中在用户对信息包的需要,信息包提供了分析人员思维模式的可视化表示。信息包图法简介10/5/202115数据仓库与数据挖掘工作:确定系统边界:决策类型、需要的信息、原始信息确定主题域及其内容:主题域的公共键码、联系、属性组确定维度:如时间维、销售位置维、产品维、组别维等确定类别:相应维的详细类别确定指标和事实:

7、用于进行分析的数值化信息10/5/202116数据仓库与数据挖掘信息包图的建立信息包:维度类别空白信息包图样式指标和事实10/5/202117数据仓库与数据挖掘〖例〗试画出销售分析的信息包图。解:首先根据销售分析的实际需求,确定信息包的维度、类别和指标与事实:(1)维度:包括日期维、区域维、产品维、客户维、广告维(待用)等。(2)类别:确定各维的详细类别,如:日期维包括年(5)、季度(20)、月(60)、日(1800),括号中的数字分别指出各类别的数量;区域维包括国家(10)、省州(100)、城市(500

8、)、销售点(8000),括号中的数字同样分别指出各类别的数量;类似地,可以确定产品维、客户维、广告维等的详细类别。(3)指标和事实:确定用于进行分析的数值化信息,包括实际销售额、计划销售额和计划完成率。10/5/202118数据仓库与数据挖掘销售分析的信息包图日期维区域维产品维客户维广告维(待用)年度(5)国家(10)产品类别(500)年龄分组(7)广告费分组(2)季度(20)省州(100)产品名称(9000)收入分组(8)月

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。