欢迎来到天天文库
浏览记录
ID:57816446
大小:219.50 KB
页数:7页
时间:2020-03-30
《数据仓库总结.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、·数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。·数据仓库的特点–面向主题–集成–相对稳定–反映历史变化数据仓库是一个面向主题的、集成的、不可更新的、随时间不断变化的数据集合,它用于支持企业或组织的决策分析处理。数据仓库,DataWarehouse,可简写为DW。 数据仓库之父BillInmon在1991年出版的“B
2、uildingtheDataWarehouse”一书中所提出的定义被广泛接受——数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策(DecisionMakingSupport)。 ◆面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。 ◆集成的:数
3、据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 ◆相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。 ◆反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓
4、库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。从功能结构化分,数据仓库系统至少应该包含数据获取(DataAcquisition)、数据存储(DataStorage)、数据访问(DataAccess)三个关键部分。发展阶段:数据仓库的架构1.数据源:他是数据仓库的基础,位于数据仓库构架的最底层,是数据仓库的数据源泉。包括各个业务处理子系统的信息。2.ETL:是数据仓库的核心。数据仓库如何高效管理数据是区别与面向操作数据库的主要标准。完成按照主题管理
5、数据,聚合数据存放于多维数据库中。3.数据存储与管理:是整个数据仓库系统的核心4.OLAP服务器:对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势5.前端展现:主要包括各种报表、查询、OLAP分析、数据挖掘等。·OLAP分析OLAP定义·OLAP(联机分析处理)是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的、并真实反映企业维特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。(OL
6、AP委员会的定义)·OLAP的目标是满足决策支持或多维环境特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。OLAP特性·快速性:用户对OLAP的快速反应能力有很高的要求。系统应能在5秒内对用户的大部分分析要求做出反应。·可分析性:OLAP系统应能处理与应用有关的任何逻辑分析和统计分析。·多维性:多维性是OLAP的关键属性。系统必须提供对数据的多维视图和分析,包括对层次维和多重层次维的完全支持。·信息性:不论数据量有多大,也不管数据存储在何处,OLA
7、P系统应能及时获得信息,并且管理大容量信息。OLAP分析·切片和切块(SliceandDice)–在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在“城市、产品、时间”三维立方体中进行切块和切片,可得到各城市、各产品的销售情况。·钻取(Drill)–钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)操作,钻取的深度与维所划分的层次相对应。·旋转(Rotate)/转轴(Pivot)–通过旋转可以得到不同视角的数据。·数据仓库的工具数
8、据源:ORACLE,MSSQL,DB2,文本文件等ETL:POWERCENTER,OWB,DB2DWM,TeradataBuilder,C,Shell,Perl,DATASTAGE,INFORMATICA,SAGENT等数据存储与管理:ORACLE,IBMUDB,SYBASEIQ等vOLAP服务器:IBMOLAPServer,ORACLEExpressserver等前端展现:–报表、查询、OLAP分析:BO,MSTR,BRIO,Cognos,–数据挖掘:IBMIM,SASEM,SP
此文档下载收益归作者所有