最新数据仓库(Data Warehouse)简介教学提纲.ppt

最新数据仓库(Data Warehouse)简介教学提纲.ppt

ID:60768480

大小:256.50 KB

页数:17页

时间:2020-12-16

最新数据仓库(Data Warehouse)简介教学提纲.ppt_第1页
最新数据仓库(Data Warehouse)简介教学提纲.ppt_第2页
最新数据仓库(Data Warehouse)简介教学提纲.ppt_第3页
最新数据仓库(Data Warehouse)简介教学提纲.ppt_第4页
最新数据仓库(Data Warehouse)简介教学提纲.ppt_第5页
资源描述:

《最新数据仓库(Data Warehouse)简介教学提纲.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库(DataWarehouse)交流数据仓库简介数据仓库的设计数据仓库的要素__________________________________________________数据仓库简介什么是数据仓库数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它并不是所谓的“大型数据库”。数据仓库的方案建设的目的,是为前端查询和分析作为基础,由于有较大的冗余,所以需要的存储也较大。__________________________________________________数据仓库简介数据仓库的目的构建数据仓库环

2、境是为了有组织地存储来自源系统的历史数据。业务系统是为了特定需求构建的,比如销售点处理、计费系统、库存控制等待。这些系统往往不是企业的基础系统,不是为了数据分析或数据挖掘而构建的。因此,为了企业整体使用,必须创建一个新的环境把这些系统的数据汇集到一个集中式区域,即数据仓库系统。__________________________________________________数据仓库简介如果没有数据仓库__________________________________________________数据仓库简介具备了数据仓库______________

3、____________________________________数据仓库简介数据仓库的主要特点1.数据仓库是面向主题的,操作型数据库的数据面向事务的,而数据仓库中的数据是按照一定的主题域进行组织。主题是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关。2.集成性:数据仓库是集成的,数据仓库的数据有来自于分散的操作型数据,将所需数据从原来的数据中抽取出来,进行加工与集成,统一与综合之后才能进入数据仓库;数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一

4、致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。3.稳定性和时变性:存量的历史数据不会被频繁的更新,数据仓库不断接受增量的数据。__________________________________________________数据仓库的设计零售业数据仓库样例__________________________________________________数据仓库的设计数据仓库的第一层——Landing层一般进入数据仓库的数据源是来自各个事实操作性系统,数据源类型可以是不同格式的文本数据文件、存于不同后台库的表数据、以及现在大数据要解决的一

5、些非结构化数据(比如图片、视频)等。数据源导入到数据仓库的第一层,叫Landing层,也可以叫做贴源层。Landing层一般可以理解为数据缓冲层,用来接收源数据,在一定时间里Hold住源数据,一边后续处理,甚至重复处理,这些处理可以完全独立于源系统。__________________________________________________数据仓库的设计数据仓库的第一层——Landing层这一步的要点:a)数据落地前后要保持一致性,避免对数据进行复杂的处理,以保证数据的快速导入而尽量减少对业务系统的压力,这就要求做好相应的审计工作。b)landi

6、ng表里要标明数据的来源库。__________________________________________________数据仓库的设计数据仓库的第二步——Staging层Landing层到Staging层主要是对数据进行必要的清洗工作。数据从landing流入staging后数据要在landing层清除。__________________________________________________数据仓库的设计数据仓库第三层——IntegrationDW该层作为数据仓库的集成部分,可以叫中央数据仓库,包含两种实体数据:事实数据(facten

7、tity)、维度数据(dimensionentity)。Factentity:它是对某个事物(可能是某一笔交易,某一个项目,如一笔到货明细,某一个任务令)的各方面信息的描述,描述行的属性包括:该事物各方面的度量信息,相关度量信息的维度信息。Dimensionentity:维度数据。这里的维度要支持业务上的最细粒度。要保证可以在最细粒度级别实现多维的分析。即能够支持汇总数据以及明细数据的多维查询。__________________________________________________数据仓库的设计数据仓库第四层——数据集市(DataMart)它

8、是面向主题领域的专业的多维数据区。实现某一特定主题领域的多维查询需求。这个部分也

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。