第4章数据仓库的设计Appt课件.ppt

第4章数据仓库的设计Appt课件.ppt

ID:59207399

大小:683.50 KB

页数:56页

时间:2020-09-26

第4章数据仓库的设计Appt课件.ppt_第1页
第4章数据仓库的设计Appt课件.ppt_第2页
第4章数据仓库的设计Appt课件.ppt_第3页
第4章数据仓库的设计Appt课件.ppt_第4页
第4章数据仓库的设计Appt课件.ppt_第5页
资源描述:

《第4章数据仓库的设计Appt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第4章数据仓库的设计与开发(一)14.1数据仓库分析与设计4.2数据仓库开发4.3数据仓库技术与开发的困难内容安排2需求分析数据装载信息查询概念设计逻辑设计物理设计数据抽取数据转换知识探索数据仓库增长数据仓库维护数据仓库评估决策支持数据获取分析与设计维护与评估数据仓库开发过程3工具介绍456784.1数据仓库分析与设计4.1.1需求分析4.1.2概念模型设计4.1.3逻辑模型设计4.1.4物理模型设计4.1.5数据仓库的索引技术94.1.1需求分析1.确定主题域2.支持决策的数据来源3.数据仓库的成功标准和关键

2、性能指标4.数据量与更新频率101.确定主题域(1)明确对于决策分析最有价值的主题领域有哪些?(2)每个主题域的商业维度是哪些?每个维度的粒度层次有哪些?(3)制定决策的商业分区是什么?(4)不同地区需要哪些信息来制定决策?(5)对哪个区域提供特定的商品和服务?112.支持决策的数据来源(1)哪些源数据(操作型)与商品主题有关?(2)在已有报表和在线查询中得到什么样的信息?(3)提供决策支持的细节程度是怎样的?123.数据仓库的成功标准和关键性能指标(1)衡量数据仓库成功的标准是什么?(2)哪些关键的性能指标?

3、如何监控?(3)对数据仓库的期望是什么?(4)对数据仓库的预期用途有哪些?(5)对计划中的数据仓库的考虑要点是什么?134.数据量与更新频率(1)数据仓库的总数据量有多少?(2)决策支持所需的数据更新频率是多少?时间间隔是多长?(3)每种决策分析与不同时间的标准对比如何?(4)数据仓库中的信息需求的时间界限是什么?14通过需求分析,需要的数据包括:1.数据源(1)可用的数据源(2)数据源的数据结构(3)数据源的位置(4)数据源的计算机环境(5)数据抽取过程(6)可用的历史数据152.数据转换数据仓库中的数据是为

4、决策分析服务,而源系统的数据为业务处理服务。需要决定如何正确地将这些源数据转换成适合数据仓库存储的数据。163.数据存储数据仓库所需要的数据的详细程度,包括足够的关于存储需求的信息,估计数据仓库需要多少历史和存档数据。174.决策分析(1)向下层钻取分析(2)向上层钻取分析(3)横向钻取分析(4)切片分析(5)特别查询报表18需求分析简单举例:194.1.2概念模型设计概念模型的特点是:(1)能真实反映现实世界,能满足用户对数据的分析,达到决策支持的要求,它是现实世界的一个真实模型。(2)易于理解,便利和用户交

5、换意见,在用户的参与下,能有效地完成对数据仓库的成功设计。(3)易于更改,当用户需求发生变化时,容易对概念模型修改和扩充。(4)易于向数据仓库的数据模型(星型模型)转换。20概念模型最常用的表示方法是实体-关系法(E-R法)。E-R图描述的是实体以及实体之间的联系,用长方形表示实体,在数据仓库中就表示主题,椭圆形表示主题的属性,并用无向边把主题与其属性连接起来;用菱形表示主题之间的联系,用无向边把菱形分别与有关的主题连接。若主题之间的联系也具有属性,则把属性和菱形也用无向边连接上。21例子有两个主题:商品和客户

6、,主题也是实体。商品有如下属性组:商品的固有信息(商品号、商品名、类别、价格等);商品库存信息(商品号、库房号、库存量、日期等);商品销售信息(商品号、客户号、销售量等);客户有如下属性组:客户固有信息(客户号、客户名、住址、电话等);客户购物信息(客户号、商品号、售价、购买量等)。商品的销售信息与用户的购物信息是一致的,它们是两个主题之间的联系。22商品商品固有信息商品号商品库存信息销售信息购物信息客户客户固有信息客户号=234.1.3逻辑模型设计主要工作为:(1)主题域进行概念模型(E—R图)到逻辑模型(星

7、型模型)的转换(2)粒度层次划分(3)关系模式定义(4)定义记录系统241、主题域进行概念模型到逻辑模型的转换星型模型的设计步骤如下:(1)确定决策分析需求决策需求是建立多维数据模型的依据。(2)从需求中识别出事实选择或设计反映决策主题业务的表,如在“商品”主题中,以“销售业务”作为事实表。(3)确定维确定影响事实的各种因素,对销售业务的维包括商店,地区,部门,城市,时间,商品等,如图4.2所示。25销售数据和维销售数据商品促销时间部门城市地区商店图4.2销售业务的多维数据26(4)确定数据汇总水平数据仓库中对

8、数据不同粒度的集成和综合,形成了多层次、多种知识的数据结构。例如,对于时间维,可以以“年”、“月”或者“日”等不同水平进行汇总。(5)设计事实表和维表设计事实表和维表的具体属性。在事实表中应该记录哪些属性是由维表的数量决定的。一般来说,与事实表相关的维表的数量应该适中,太少的维表会影响查询的质量,用户得不到需要的数据,太多的维表又会影响查询的速度。27(6)按使用的DBMS和分析用户工

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。