数据仓库技术2011new

数据仓库技术2011new

ID:34411148

大小:2.68 MB

页数:32页

时间:2019-03-05

数据仓库技术2011new_第1页
数据仓库技术2011new_第2页
数据仓库技术2011new_第3页
数据仓库技术2011new_第4页
数据仓库技术2011new_第5页
资源描述:

《数据仓库技术2011new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库技术数据仓库技术1、数据仓库(DataWarehouse)数据仓库是信息的逻辑集合,这些信息来自于许多不同的业务数据库,并用于支持企业的分析活动为什么使用数据仓库?和决策任务。传统的数据库对企业的决策支持作用有限企业大量的数据资源没有得到充分的利用哪些客户是“数据爆炸而知识贫乏”公司的金牌客户?提高数据存储和数据分析的效率背景背景现代政府机构经常面临各种挑战和决策,如何最大限度地挖掘和利用有用信息,更好地为政府工作服务已经成为计算机信息处理技术领域中的一个新课题。数据库中的处理可以大致分为操作型处理和分析型处

2、理。为了提高分析和决策的效率和有效性,必须把分析型数据从操作型处理环境中提取出来,建立单独的分析处理环境。数据仓库正是为了构建这种新的分析处理环境而出现的一种数据存储和组织技术。什么是数据仓库数据仓库是面向主题的、集成的、稳定的、不同时间的数据集合、用于支持经营管理中决策的制定过程。22数据仓库的特征数据仓库的特征数据仓库是面向主题的数据仓库的数据是集成的数据仓库的数据是多维的数据仓库的数据是相对稳定的数据仓库支持决策而不是事务处理面向主题的面向主题的数据仓库围绕一些主题,排除对于决策无用的数据,提供特定主

3、体的简明视图。主题是归类的标准,一个主题对应一个宏观的分析领域。集成的集成的构造数据仓库是将多个异种数据源汇集在一起,须经过加工与集成,确保命名约定,编码结构,属性度量等一致性。数据仓库的多维性数据仓库的多维性年份顾客分类信誉度北区西南区东南区东区西区产产产产品品品品1234信用卡客户基本情况信息客户基本信息事实表客户编号职业维表客户主卡帐号主卡人姓名主卡人身份证家庭状况维表住址维表号性别出生日期担保人维表职业授信额度维表住址每月收入开户销户维表家庭状况担保人附卡维表授信额度开户销户附卡…………稳定的数据仓库包含了

4、大量的历史数据,数据经集成后极少或根本不更新的。随时间变化的数据仓库的数据时限在5-10年,因此数据的键码包含时间项,表明数据的历史时期,适合DSS进行时间趋势分析。数据仓库的特点数据仓库的特点–数据大集中,汇总异构数据–数据与业务系统脱离,保障业务系统的安全和效率–完成数据的抽取与清洗–提供连续数据的长期存储–其软硬件要求较高数据仓库最根本的特点是它虽然物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。数据仓库的建立并不是要取代数据库,它要建立在一个较全面和完善的信息应用的基础上,用于支持

5、高层决策分析。数据仓库实质是一个决策支持环境,它从不同数据源获得数据、集成数据、组织和管理数据,使得数据有效地支持决策分析。数据仓库的数据反映的是在相当长的一段时间内历史数据的内容,是数据库中重要数据的集合,以及基于这些重要数据进行统计、综合和重组的导出数据。数据仓库中存在着不同的综合级别,一般称之为“粒度”粒度越大,表示细节程度越低,综合程度越高。由各由各业务数据库建立数据仓库业务数据库建立数据仓库数据客户细分统仓库一与综合年/月/周求合计顾客数据库计费数据库财务数据库数据仓库也有一个数据字典,除包含信息的逻辑结构外

6、,还包含两个附加的重要特征,即信息的来源和处理方式。数据仓库的物理设计数据仓库的物理设计划分粒度粒度:是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度越小,级别越低,反之,粒度越大,级别越高。如区域粒度、时间粒度。进行分割(分类)数据分割:将逻辑统一的数据分割成较小的、可以独立管理的物理单元进行存储,以便重构、重组和恢复。数据集市数据集市数据集市是一种更小、更集中的数据仓库,是为公司提供分析商业数据的一条廉价途径。它主要针对某个具有战略意义的应用或具体部门的应用。数据集市种类数据集市种类独立的数据集市:

7、数据直接来源于数据源。从属的数据集市:数据来源于中央的数据仓库。两种数据集市两种数据集市数据源……数据源数据源……数据源独立数据集市中央数据仓库从属数据集市分析工具……分析工具分析工具……分析工具数据集市的特性数据集市的特性(1)规模是小的(2)面向特定的应用(3)面向部门(4)由业务部门定义、设计和开发(5)快速实现(4)可升级到完整的数据仓库数据集市与数据仓库的区别数据集市与数据仓库的区别(1)数据仓库是基于整个企业的数据模型建立的,它面向企业范围内的主题,而数据集市是按照某一特定部门的数据模型建立的。(2)部门的

8、主题与企业的主题之间可能存在关联,也可能不存在关联是,因此数据仓库存储整个企业非常详细的数据,数据集市的数据详细程度低些。(3)数据集市的数据组织一般采用星型模型,数据仓库的数据组织,采用第三范式。数据仓库系统数据仓库系统数据仓库系统是由数据仓库(DW)、仓库管理和分析工具三部分组成。其结构如下图所示:数据仓库系统的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。