数据仓库第二章数据仓库组成部分

数据仓库第二章数据仓库组成部分

ID:40506529

大小:285.92 KB

页数:20页

时间:2019-08-03

数据仓库第二章数据仓库组成部分_第1页
数据仓库第二章数据仓库组成部分_第2页
数据仓库第二章数据仓库组成部分_第3页
数据仓库第二章数据仓库组成部分_第4页
数据仓库第二章数据仓库组成部分_第5页
资源描述:

《数据仓库第二章数据仓库组成部分》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、ChapterTwo数据仓库组成部分本章学习目标数据仓库的定义区分数据仓库和数据集市学习数据仓库的每一个组成部分介绍元数据的概念和它的重要性提纲2.1定义的特点2.2数据仓库和数据集市2.3数据仓库的组成部分2.4元数据MetaData数据仓库的创始者BillInmon:“ADataWarehouseisasubjectoriented,integrated,nonvolatile,andtimevariantcollectionofdatainsupportofmanagement’sdecisions.”“数据仓库是为支持管理决策建立的,面向主题的,综合的,稳定的,

2、随时间变化的数据集合”数据仓库的开拓者SeanKelly,认为数据仓库中的数据是:彼此分离可利用的综合的包含时间标记的面向主题的非易失性的能访问的2.1定义的特点“面向主题”的数据在操作型系统中,各行业的数据集合都是围绕单独的应用程序进行组织的在数据仓库中数据是按主题而不是按照应用程序存储的。数据是跨应用程序的订单处理客户贷款顾客帐单可接收帐款索赔处理储蓄帐目销售产品客户帐户索赔政策操作型应用程序数据仓库主题储蓄帐户支票帐户贷款帐户主题=帐户来自应用程序的数据数据仓库主题“综合”的数据数据仓库中的数据来自不同的数据库、文件、数据段。(内部或者外部,不同的平台)数据进入数

3、据仓库前,需要进行的标准化工作:命名规则编码数据特性度量单位数据的“时间特性”数据仓库中的每一个数据结构都包含了时间要素。数据仓库中的数据是和时间变化相关的数据可以对过去进行分析与当前的信息相关可以对未来进行预测数据的非易变性操作型系统的数据实时地进行更新,每次交易发生都要更新;数据仓库中的数据非实时性更新数据仓库中的数据用来进行查询和分析的不能在数据仓库中实时地删除数据不能在数据仓库中修改数据决策支持系统操作型系统OLTP数据库数据仓库读取增加修改删除读取DataGranularity数据粒度:数据的细节程度在操作型系统中,数据粒度一般都很细。一般不保存加和的数据。在

4、数据仓库中,保存加和这一个数据项。一般来说,按不同层次组织数据,用户是从高层次向低层次的细节过渡。根据需求的不同,需要不同层次的数据细节。每日数据帐户交易日期数额存款取款月汇总帐户月份交易数取款存款期初结余期末结余季度汇总帐户月份交易数取款存款期初结余期末结余银行数据仓库的三个层次数据粒度2.2数据仓库和数据集市数据仓库和数据集市是一个混淆不清的概念。是学术界争论的话题BillInmon(1998):“今年IT经理面对的最重要的问题就是到底先建数据仓库还是先建立数据集市”,今天依然如此。在建立数据仓库前,我们需要考虑下列这些问题:采取自上而下还是自下而上的方法企业范围还

5、是部门范围先建立数据仓库还是数据集市数据集市是否相互独立数据仓库vs.数据集市(DataMart)数据仓库数据集市完整的,从企业整体考虑的部门的所有数据集市的集合一个单独的商业处理过程从阶段区域得到的数据星型结构通过展示的方式进行查询适合数据连接和分析技术基于公司数据视角的结构基于适合部门数据视角的结构通过实体-关系模式进行组织自上而下的方法优点可以从整个企业的角度看待数据有机的结合,不是彼此分离的数据集市组成数据内容唯一、集中存储集中控制和集中的规则对反复的查询能够做出快速的反映缺点需要花费较多的时间建造失败风险很大需要高水平的总和技能费用很高自下而上的方法优点实施快

6、速而方便良好的投资回报失败的风险较小可以先建立重要的数据集市项目团队可以从中学习和成长缺点每个数据集市对数据的视角都较窄每个数据集市都有多余的数据总有矛盾和不一致的数据增加无法管理的接口折中的思想,主要推崇者为著名的数据库专家RalphKimball,主要步骤如下:从整个企业的角度来计划和定义需求为完整的仓库创造一个体系结构使数据内容一致而且标准化将数据仓库作为一组超级数据集市来实施,每次一个2.3数据仓库的组成部分数据仓库:各个功能块或组件2.3.1源数据部分主要类别生产数据:多个系统多种数据的标准化、转换、整合内部数据:表格、文档存档数据:旧的历史的数据外部数据:社

7、会的企业,社会的人2.3.2数据准备部分ETL(ETCL)数据抽取(Extract):多源、异构数据的抽取数据转换(Transform):清洗、标准化等过程数据装载(Load)这个过程需要很多的时间最初的装载工作需要载入大量的数据更新周期的决定(年、季、月、日)2.3.3数据存储部分数据仓库的数据存储器是一个独立的部分与操作型的数据库分开存储大多数数据仓库都采用关系数据库管理系统2.3.4信息传递部分多种信息传递方式特别的报表复杂的查询多维分析统计分析主管信息系统的需求数据挖掘2.4元数据MetaData描述数据的数据数据仓库内容的一本字

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。