数据仓库的挑战和展望

数据仓库的挑战和展望

ID:40506306

大小:627.60 KB

页数:43页

时间:2019-08-03

数据仓库的挑战和展望_第1页
数据仓库的挑战和展望_第2页
数据仓库的挑战和展望_第3页
数据仓库的挑战和展望_第4页
数据仓库的挑战和展望_第5页
资源描述:

《数据仓库的挑战和展望》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、学号:10720938姓名:赵海红数据仓库新的应用与面临问题7/15/2021提纲数据仓库的实质与价值数据仓库新的应用与环境数据仓库的模型与设计方法传统的数据仓库体系结构及其改进数据仓库的操作问题展望7/15/2021提纲数据仓库的实质与价值数据仓库新的应用与环境数据仓库的模型与设计方法传统的数据仓库结构及其改进数据仓库的操作问题展望7/15/2021数据仓库的实质与价值数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision-Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需

2、要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据、数据仓库、数据应用:7/15/2021数据仓库的实质与价值从图中可以看出数据仓库的数据来源于不同的源数据,并提供多样的数据应用,数据自下而上流入数据仓库后向上层开放应用,而数据仓库只是中间集成化数据管理的一个平台。数据仓库从各数据源获取数据及在数据仓库内的数据转换和流动都可以认为是ETL(抽取Extra,转化Transfer,装载Load)的过

3、程,ETL是数据仓库的流水线,也可以认为是数据仓库的血液,它维系着数据仓库中数据的新陈代谢,而数据仓库日常的管理和维护工作的大部分精力就是保持ETL的正常和稳定。7/15/2021数据仓库的价值高效的数据组织形式时间价值集成价值历史数据7/15/2021提纲数据仓库的实质与价值数据仓库新的应用与环境数据仓库的模型与设计方法传统的数据仓库结构及其改进数据仓库的操作问题展望7/15/2021数据仓库新的应用领域随着数据仓库的技术的发展和普及,将来可能在以下俩方面提出新的发展瓶颈和挑战:首先,是对新数据类型的出现,提出新的数据仓

4、库技术对其支持非传统的系统架构和新的需求,在数据仓库技术中可以找到好的解决办法7/15/2021空间数据仓库随着移动互联网和基于位置服务的发展,同时卫星遥感,GPS,医药成像以及其他空间可计算工具获得数据的普及,我们获取了大量的关于时空的数据。但是,这些数据的结构复杂,数据量大的特点,对其处理和分析的技术还有一定的欠缺,近年来,提出了空间数据仓库的概念,现在已经存在了几个大型的空间数据仓库。例如美国的联合国环境规划署(EP)7/15/2021空间数据仓库空间数据仓库是融合了数据仓库跟空间数据库技术,利用这两种技术提高了对大

5、量空间数据的处理、分析、管理的能力,但是现在还是存在一下几种挑战:空间数据粒度的划分空间数据的分割空间数据的集成当前数据仓库的数据模型标准化推广空间DW对决策系统的支持对空间DW的多维度表示7/15/2021Web数据仓库7/15/2021Web数据仓库7/15/2021本体数据仓库7/15/2021本体数据仓库7/15/2021其他领域数据仓库生命科学数据仓库模式数据仓库7/15/20217/15/2021数据仓库新的应用环境业务流程数据仓库数据流,实时动态数据仓库数据仓库与云计算7/15/2021提纲数据仓库的实质与价

6、值数据仓库新的应用与环境数据仓库的模型与设计方法传统的数据仓库结构及其改进数据仓库的操作问题新的挑战7/15/2021数据仓库模型与设计方法数据仓库建立模型的过程实际上是一个从关系型、规范式的数据模型向多维模型转换的过程。其中数据仓库建模和数据仓库开发方法是数据仓库的构建过程中最为关键的技术环节,它直接决定数据仓库构建的成败。7/15/2021数据仓库建模①概念建模概念建模为数据仓库的设计提供了一个高层次的抽象,从各个方面描述了数据仓库的过程和体系结构,从而完成数据仓库的实施。通常,借助于图形表示法能让设计者和商业用户更方

7、便的对概念模式进行表达、理解和管理。现有的方法可以分为三类:扩展ER模型;扩展UML模型;特殊的模型。当前概念模型存在的问题有以下:缺乏标准概念模型安全问题Mining-awaredesign7/15/2021逻辑建模②逻辑建模逻辑建模的总体任务是将概念模型转换成逻辑模型。在数据仓库领域,目标数据库系统通常要么是关系型的,要么是多维的。对于关系型的而言,人们普遍采用所谓的星型、星座和雪花模型来处理数据立方体,并且各个厂商也对这些模型提供支持。关于多维模型的实施,人们提出几种有效的多维数据结构,如浓缩数据立方体来管理数据立方

8、体。当前逻辑模型最大的存在问题:概念数据模型与关系或者数据立方多维实现的语义差别的问题7/15/2021物理建模③物理建模根据逻辑模型设计阶段的星型模型或雪花模型能够方便地定义物理数据结构,一般将指标实体转化为物理数据库表,称为事实表。事实表首先包括星型模型中心的指标量,其次应包括星型模型角上的维度实体

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。